En Hawkes-process för att göra medvetna om hur allvarligt COVID-19-utbrottet är: tillämpning på ärenden i Frankrike

Av Laurent Lesage

Vi föreslår en enkel modell baserad på Hawkes processer för att förstå COVID-19 smitta och för att göra människor medvetna om allvarligheten i situationen. Vi är inte epidemiologer och vi låtsas inte att vi kan förutsäga det framtida antalet fall exakt. Vårt mål är att se att vår modell, som är enkel och inte tar hänsyn till många externa faktorer, tillåter oss att fånga utbrottets globala trend och att lyfta fram det faktum att utan en förändring av människors beteende kan utbrottet vara utom kontroll. Modellens originalitet är att fokusera på utbredningshastigheten snarare än på antalet fall. För mer information kan du titta på vårt forskningsdokument om detta ämne.

Del 1: Metod

Vi använder en Hawkes-process för att modellera utvecklingen av utbrottet i Frankrike och för att göra franska människor medvetna om allvarligheten i situationen. Många modeller och datavisualiseringar som behandlade detta ämne föreslogs av olika forskare under de senaste dagarna. I synnerhet presenterar denna studie några likheter med vår modell genom att använda en Poisson autoregressiv modell för att passa utvecklingen av utbrottet i Kina, Iran, Italien och Sydkorea.

Hawkes-processen (HP) är uppkallad efter Alan G. Hawkes, som introducerade begreppet självspännande punktprocesser. HP är en punktprocess som modellerar förekomsten av infektioner. Vi anger N (t) HP, som representerar antalet fall vid tidpunkten t. Vi anger också H (t) de historiska uppgifterna om processen fram till tiden t, det vill säga de tidigare smitterna.

Istället för att modellera N (t) direkt, arbetar vi med λ * (.), Som representerar utbredningshastigheten för utbrottet. Matematiskt sett är λ * (.) Funktionen för villkorad intensitet och definieras av:

Med denna definition kan vi skriva:

vilket är ganska lätt att förstå, även utan att vara expert på matematik och sannolikhet. Denna ekvation visar att sannolikheten för att observera ett nytt fall mellan t och t + dt är proportionell mot * * (t). Med andra ord, ju högre λ * (t) är, desto snabbare växer N (t).

Denna ekvation gäller för alla typer av punktprocesser. För en HP har funktionen för villkorad intensitet en viss form:

vilket också är ganska lätt att läsa:

  • den första termen, λ> 0, är ​​bakgrundens intensitet, som modellerar infektionen från främmande länder,
  • den andra termen, summan i k, är den självspännande delen av processen. För varje t_k, som representerar de tider då en smitts inträffade tidigare, lägger vi till en ny del μ (t-t_k) som ökar λ * (t). Det innebär att varje händelse "väcker" processen genom att öka utbredningshastigheten och sannolikheten för att en annan smittsamhet inträffar på kort tid. Det är vad som händer under ett utbrott: varje nytt fall kan överföra viruset till andra människor och sedan orsaka nya infektioner. μ (.) är en minskande funktion: vi antar alltså att varje patient är mindre och mindre smittsam över tiden (vilket inte alltid är sant enligt vissa forskare).

Del 2: Resultat

Vi har använt modellen på data från GitHub-förvaret från Centre of Systems Science and Engineering (CSSE) från Johns Hopkins University, där vi kunde hitta tidsserien med bekräftade fall i Frankrike från 22 januari till 16 mars.

Passar på data fram till 8 mars och back-test på data från 8 mars till 16 mars

Vi lär oss vår modell på data som observerats fram till 8 mars, det vill säga att vi uppskattar värdet på λ och formen av μ (.). För att kontrollera om vår modell är korrekt, simulerar vi utvecklingen av utbrottet från 8 mars till 16 mars enligt vår modell, sedan jämför vi vad som ger HP med faktiska data.

Figur 1 visar jämförelsen mellan simuleringen och de verkliga data:

Figur 1 visar att modellen fångar den globala utvecklingen av utbrottutvecklingen och validerar vår strategi, även om den inte är helt korrekt. Den 16 mars är uppskattningen av antalet fall 5 208,96, medan det faktiska antalet smittade är 6 130. Ändå är dynamiken mellan vår modell och de faktiska uppgifterna densamma, med en exponentiell tillväxt av antalet infekterade.

Vi kan i figur 2 observera kurvorna för den uppskattade intensiteten och utvecklingen av antalet fall, från 26 februari till 16 mars:

Vi ser att intensitetens toppar motsvarar de ögonblick då utbredningshastigheten är högre. Vice versa, det saktar ner när intensiteten är låg.

Anmärkning: de 6 130 ärendena totalt 16 mars kunde verka relativt låga jämfört med de 67 miljoner människor i Frankrike. Men låt oss fokusera 1 / λ * (.) Istället för λ * (.). 1 / λ * (.) Representerar tiden mellan två infektioner och planeras i figur 3:

Vi ser att den 16 mars (den sista observationen) är ankomsttiden mycket låg: ett nytt fall dyker upp var 52 sekund! Det är dock en omedelbar hastighet, det faktiska genomsnittliga antalet bör vara mer runt 2 eller 3 minuter. Men ändå är det dramatiskt eftersom vi påminner om att det bara finns 5 000 intensiva vårdsängar i Frankrike. Utan omedelbar åtgärd kommer hälsosystemet att bli helt överväldigat.

Simulering till 26 mars

Det är den mest intressanta (och skrämmande) delen. Det gör att vi kan ha en uppskattning av antalet infektioner på tio dagar (torsdag 26 mars). Vi fokuserar på två scenarier: antingen dynamiken i utbrottet förblir densamma, eller så franska folket ändrar sina sociala vanor i enlighet med åtgärder som vidtagits av den franska regeringen.

Scenario 1: dynamiken förblir densamma

I ett första scenario uppskattar vi antalet infektioner, om dynamiken i utbrottet förblir densamma på tio dagar (torsdag 26 mars), det vill säga om franska människor inte ändrar sin sociala interaktion under de senaste veckorna av Mars.

Scenario 2: Den franska befolkningen respekterar karantänåtgärder

I ett andra scenario antar vi att den franska befolkningen följer åtgärder som vidtagits av den franska regeringen den 17 mars (karantän). För att ta hänsyn till dessa beslut anpassar vi vår HP-modell till en icke-linjär form:

där t_m är tiden då åtgärderna vidtas (dvs. 16 mars). Denna modell tillåter funktionen för villkorad intensitet att minska från t_m, tack vare den hämmande delen min [1, (t / t_m) ^ a]. a är en parameter lärd av utvecklingen av utbrottet i Kina, där karantänerna var effektiva och bromsade utbrottet.

Vi ser i figur 4 jämförelsen mellan de två scenarierna:

Det visar att vidtagande av åtgärder för att respektera karantänåtgärder skulle minska antalet uppskattade fall betydligt. Vi får ett uppskattat antal fall av 51 642 fall i det första scenariot, och 14 621 fall i det andra scenariot, ungefär tre gånger mindre! Dessutom ser vi att utvecklingen av utbrottet utan ändring av sociala interaktioner bekräftar den trend som uppskattas av många andra modeller: antalet fall skulle fördubblas var tredje dag.

En viktig kommentar: data vi har arbetat med är bara antalet officiella ärenden. Vi kan rimligen tro att det faktiska antalet fall är mycket högre, eftersom sjukhusen inte har tillräckligt med läkare och material för att testa alla människor som vill. Att ha COVID-19-symtom räcker inte för att testas. Enligt Worldometers utfördes 11 895 test på den franska befolkningen den 9 mars, för 1 209 officiella fall, det vill säga en nivå på 10,1% positiva test. Låt oss anta att denna takt är densamma för vår simulering. Det betyder att 51 642 / 10,1% = 511 306 test skulle ha utförts, det vill säga bara 0,7% av befolkningen! Följaktligen skulle det faktiska antalet fall vara mycket högre än vårt uppskattade antal. Det är svårt att kvantifiera, men vi kan föreställa oss att läkare bara kunde fokusera på ett fall av 3, ett fall av 5 eller till och med ett av 10.

För mer detaljer

Du kan se vår artikel om detta ämne, som beskriver metodens huvudsteg (montering, back-test, etc.) och fokuserar på modellens matematiska aspekter.

Slutsats

Som en slutsats visar vår modell med HP att COVID-19 verkar ha en självspännande dynamik. Simuleringarna bekräftar att utvecklingen av utbrottet är exponentiellt om människor inte ändrar sina vanor och att det kan minskas avsevärt genom att vidta liknande åtgärder än Kina. Alla borde bli medvetna om allvarligheten i situationen och anta de åtgärder som vidtas av regeringen för att minska utbrottet.