Ett glimt av Coronavirus

Jag är ny i datavetenskapens värld men har alltid varit förtjust i den. Så jag vill implementera några av mina nya kunskaper som jag har fått från onlinekurs och olika onlinekällor i den här artikeln.

Coronavirus-utbrott har varit ett globalt problem för några veckor tillbaka. Eftervirkningen täcker många fall såsom ekonomi, egendom, liv osv. Som ni antagligen vet, är det ett nytt andningsvirus som först identifierades i Wuhan, Kina.

Figur 1. Coronavirus

Stort tack till Datakaggle.com som öppnar uppgifterna offentligt. Vår törst efter uppenbarelse kan fästas. Jag använde python för att krossa och visualisera data. Först importera relevanta bibliotek till kalkylbladet.

Bild 2. Importera biblioteket

Inget riktigt fint på biblioteket jag använde. följaktligen, kallade ut uppgifterna bara för att bekanta sig med kolumnerna och datatyperna. Som framgår av bilden nedan är datumformatet för den första raden (index = 0) och de andra raderna (index = 1 :) olika. Jag har inte kontrollerat hur det kommer att påverka databehandlingen men jag personligen inte underhålla det utseendet. Nedan konverterade jag den med hjälp av module parse från dateutil.parser. Jag hanterade också några saknade värden (NaN) på tabellerna, men sedan jag testade det är det bara en noll som avsiktligt lämnas tom.

Bild 3. Databehandling

Jag var nyfiken på att ta reda på hur mycket är fluktuationen av de bekräftade offren för Kina och icke-Kina. Jag delar upp medvetet detta i distinkta variabler eftersom jag vill veta hur reagerar och uppför sig dessa två. Sedan den 21 januari har antalet ökat snabbt tills det nådde sin topp den 2 februari (OBS: detta är inte ackumulering utan dagligt rekord)

Bild 4. Fluktuationen av bekräftade offer på KinaBild 5. Fluktuationen av bekräftade offer för Non_China

För icke-Kina verkar mängden offer öka och träffade toppen den 31 januari. Från diagrammet (figur 5) bildar de flesta drabbade länder mönster med upp- och nedgångar. Kan det vara någon korrelation mellan länder? Logiskt, ja, ja! Utbrottet i ett område kan potentiellt spridas till de andra, särskilt de angränsande länderna.

Bild 6. Stolpediagram över bekräftade offer

Från ovanstående stapeldiagram (figur 6) kan man se att de flesta offren är i Kina. Virusutbrottet spred sig enormt över hela Kina. Det är helt förståeligt om Thailand och Hongkong tronar den första respektive den andra positon eftersom dessa länder är coterminösa till varandra. Samma regel gäller för Malaysia och Singapore.

Bild 7. Tillägget till återställningsområdet och dödsområdet

Jag mäter återhämtnings- och dödshastigheten relativt de bekräftade offren (figur 7). Under det villkoret kan vi skapa en jämförbar och fruktbar uppfattning.

Bild 8. Diagrammet för återhämtning och dödstakt för Kina

Från diagrammet ovan kan vi se att återhämtningsinitiativet har startats sedan 22 januari och det har varit framgångsrikt att hantera de infekterade offren. Icke desto mindre verkar återhämtningstakten gradvis minska, tills den 26 januari överträffade döden återhämtningstakten. det är uppenbart att även Kinas regering har genomfört större återställningar, viruset har påverkat Kina snabbare än så.

Bild 9. Diagrammet för återhämtning och dödstempo för icke-Kina

Det som verkar vara mer spännande är hur uppträder länder utanför Kina i denna instans. Behandlingen har gått grönt sedan den 25 januari. Inom detta tidsintervall registrerades endast en död på The Philipines (02/20/2020). Coronavirus har tagits på allvar av de flesta länder och har varit en global fråga sedan utbrottet.

Bild 10. Jämförelse av bekräftade och återhämtade offer

Figur 10 visar hur är återhämtningsprocessen jämfört med bekräftade offer. Grafen visualiserar inte att läkningsprocessen i Hubei är mycket bättre än resten av staden i Kina. Högre antal betyder inte alltid bättre, vi måste faktiskt göra det till förhållande. Vi bör dock uppskatta stadens ansträngningar att återhämta sig.

Bild 11. Geomap of Coronavirus Outbreak

Sist men inte minst använde jag mallen som är utvecklad av Parul Pandey från Kaggle. Från figur 11 kan vi helt och hållet se vilken kontinent som är mest skadad. Det är uppenbart att Asien har de flesta infekterade länder följt av Europa, Amerika och Australien. Det finns faktiskt ett fall på Elfenbenskusten, det visas inte på kartan eftersom jag tappade från bordet. Det är ganska svårt att hitta latitud och longitud av Elfenbenskusten. Förlåt min latskap. haha. Observera att dessa data hämtades till 2 februari, resultatet och interpetrationen kan skilja sig åt.

Hoppas att denna EDA hjälper dig att få ett bättre grepp om vad coronavirus ger oss alla. Låt oss bara hoppas på det bästa!

Skål!