En närmare titt på de rapporterade Coronavirus-numren i perspektiv

Analyser av ärendenummer med avseende på landstorlekar

Friskrivningsklausul: Mot Data Science är en Medium-publikation som huvudsakligen baseras på studien av datavetenskap och maskininlärning. Vi är inte hälso- och sjukvårdspersonal eller epidemiologer, och åsikterna i denna artikel bör inte tolkas som professionella råd. Om du vill veta mer om coronavirus-pandemin kan du klicka här.

På bara några månader har koronaviruset (COVID-19) spridit sig över hela världen, vilket lett till en de facto global pandemi. I många länder och regioner växer de bekräftade fallen fortfarande exponentiellt. Efter de rapporterade bekräftade numren dagligen är jag mycket bekymrad över hur viruset påverkar människors liv, marknader och global ekonomi. Ursprungligen från Peking, Kina, är minnet om SARS-utbrottet 2003 friskt. Men jag var förvånad över att få veta att så många människor i väst är så likgiltiga mot svårighetsgraden av COVID-19: "Det är bara en influensa", "det påverkar bara gamla människor", "media propaganda", "flockimmunitet" ... Dessa höjder från allmänheten håller mig uppe på nätter.

Kanske är vissa människor inte imponerade av det rapporterade antalet fall och tror att de flesta av de infekterade fallen är långt borta på andra sidan världen. Jag håller verkligen med att se på de bekräftade ärendena är abstrakta. Här gjorde jag några tomter för att sätta dessa siffror i perspektiv.

Varning: modellen är bara lika bra som datakällan. Alla de bekräftade fallen av COVID-19 tillhandahålls av Johns Hopkins University Center for Systems Science and Engineering (JHU CSSE), som sammanställde officiellt rapporterade siffror från WHO och regeringar runt om i världen. Utan tvekan finns det underrapportering från de flesta länder på grund av bristen på diagnostiska tester, brist på öppenhet från regeringarna och människor som inte tar testet på grund av okunnighet.

Alla siffror nedan är baserade på bekräftade COVID-19 fall från och med den 15 mars 2020.

Kumulerade ärenden på regionnivå

De mest berörda länderna / regionerna genom kumulerade bekräftade COVID-19 fall

Många visualiseringar (som denna) visar bara statistik på landsnivå. Från tomten på regionnivå kan vi separera olika provinser i Kina och stater i USA. Hubei, en gång episoden av COVID-19, tillsammans med nästan alla andra provinser i Kina, har plattat ut i antalet bekräftade fall. Iran, Sydkorea, Italien, tillsammans med många europeiska länder överträffade många Guangdong, den 2: a hårdast drabbade kinesiska provinsen.

Passar den exponentiella tillväxten

Låt oss nu undersöka hur snabb COVID-19 sprider sig inom regioner. Jag monterade de ackumulerade bekräftade fallen med en exponentiell funktion, y = exp (a + bx). Här använde jag vanliga minsta kvadrat (OLS) för att bestämma parametrarna a och b, lutningen b motsvarar den exponentiella kurvens branthet.

I verkligheten följer nästan ingenting exponentiell tillväxt på obestämd tid. Emellertid kan det initiala utbrottet av en infektionssjukdom modelleras med en exponentiell funktion. För olika regioner anpassade jag det kumulerade antalet bekräftade COVID-19 fall under denna initiala period, definierad av att ha 50 fall under minst 5 till 10 dagar. Efter att ha sorterat de monterade backarna (b) från exponentiella funktioner hittade jag en slående lista över länder med tillväxttakt som är större än Hubei runt lockdownen den 01/23, inklusive Iran, Finland, Portugal, Italien, Sydkorea, Danmark, Slovenien och Spanien , av vilka många upplever den exponentiella tillväxten nu (från och med 15 mars). Dessutom rankade staten New York och Washington i USA också 15 och 19 bland de snabbaste spridningsregionerna i världen.

Snabbast spridande regioner / länder. Legenden indikerar b i exponentiell funktion och datumperiod som används för att passa tillväxtkurvan.

På baksidan kan vi också upptäcka regioner och länder med den långsammaste spridningen av COVID-19. De 20 bästa är nästan uteslutande i Asien, av vilka många är avlägsna och mindre befolkade provinser i Kina som Ningxia, Inre Mongoliet och Xinjiang. Observera att COVID-19 fall förekommer i Singapore och Japan sedan mitten av februari men ändå spridit mycket långsammare, förmodligen på grund av ett tidigt och effektivt genomförande av social distans.

Långst spridande regioner / länder.

Normalisera till befolkning

Ett sätt att sätta antalet smittade i perspektiv är att normalisera det mot befolkningens storlek i regionen eller landet. Nedan plottar jag de 20 bästa regionerna / länderna med den största andelen av befolkningen som är smittad med COVID-19. San Marino, en inlindad mikrostat omgiven av Italien, rankade den första i COVID-19-täthet efter befolkning. Andra länder med låg befolkning som Island toppar också listan.

Normalisera till område

Ett annat sätt att känna till antalet smittade är att normalisera sig mot området i regionen / landet för att härleda fallens täthet när det gäller geografi. Återigen, San Marino toppar listan på grund av det lilla området. Många städer och stater är också bland de bästa: Macau, Singapore och Washington DC.

Normalisera till sjukhuskapacitet

Ett mer effektfullt sätt att sätta antalet COVID-19 ärenden i perspektiv är att kvantifiera sin börda för sjukhus inom regionerna. Detta kan göras genom att normalisera mot sjukhuskapaciteten, som mäts med det uppskattade antalet sjukhussängar.

De nuvarande COVID-19-infekterade patienterna räcker för att uppta 72% av sjukhussängarna i San Marino, som bara har ett sjukhus. Andra länder med mycket hög börda inkluderar Island, Iran, Italien och Qatar, med COVID-19-patienter som tar över 10% av sjukhussängarna. Observera att detta förutsätter det bästa fallet där patienter är proportionellt fördelade runt sjukhus så att de inte översvämmar till samma sjukhus.

Man bör också ta hänsyn till antalet bäddar i ICU och antalet tillgängliga mekaniska ventilatorer, som är avgörande för att rädda patienter med allvarliga symtom. Enligt American Hospital Association står sängar i ICD för ~ 5% av alla sjukhussängar i USA. Förutsatt att alla dessa patienter skulle behöva ICU-vistelse blir ~ 10% sjukhussängar en skrämmande ~ 200% ICU-kapacitet.

Uppdaterad sjukhusbörda baserad på bekräftade fall fram till 21 mars

Jag kunde uppskatta sjukhussängar för stater i USA med hjälp av data härifrån. Som du kan se på tomten har de bekräftade fallen i San Marino redan överskridit antalet sjukhussängar. Italiens sjukhusbörda hoppade till ~ 23%. Tre stater i USA, New York, Washington och New Jersey rankade också i topp 20, med 16%, 12% och 4% alla sjukhussängar som potentiellt ockuperas av bekräftade COVID-19 fall, förutsatt att alla kräver sjukhusvistelse.

koder:

https://github.com/wangz10/covid_19_analyses