COVID-19: prédire le nombre de patients atteints de coronavirus

Le coronavirus a finalement capturé le monde entier - et cela ne s'exprime pas dans le fait que chaque habitant de la planète a réussi à l'obtenir. Pour le moment, ce sujet est le principal et le seul - à la fois dans le monde et dans l'actualité russe. Dans cet article, nous essaierons de faire abstraction autant que possible de la politique et des arguments pour savoir si l'armée chinoise a lancé le virus ou Donald Trump. Au lieu de cela, nous examinons le problème d'un point de vue mathématique - à savoir, nous découvrirons comment nous pouvons décrire l'épidémie avec une équation, et à la fin de l'article, nous prédirons le nombre total de COVID-19 infectés - y compris en Russie.



UFO Care Minute


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, .

, , .

: |

:


Il y a encore un peu moins d'un siècle, en 1927, deux scientifiques Kermak et McKendrick, dans leur article, ont mis au monde l'idée que la propagation de l'épidémie peut être décrite mathématiquement. Dans le cas le plus simple, lorsqu'une population de N personnes est infectée par une sorte de virus, et dans la population elle-même, les gens peuvent être en bonne santé ( S ) ou tomber malades sans possibilité de rétablissement ( I ), l'équation de la proportion de la population infectée au moment t ressemblera à ceci:

je(t)=je0je0+(1-je0)e-βt,


je0représente la proportion initiale de personnes infectées dans la population totale, et βresponsable de la propagation de l'épidémie - et c'est grâce à ce paramètre que l'on peut réguler la probabilité de transmission du virus de personne à personne et zoomer / dézoomer le moment où toute la population est infectée (car quandt,je(t)1)

Il peut sembler aux connaisseurs que les gars ont emprunté l'équation de la courbe logistique au mathématicien belge Verhulst - cependant, dans ce cas, cette équation n'est que le résultat de la résolution d'un système d'équations différentielles (je n'entrerai pas dans la jungle mathématique, mais si quelqu'un est intéressé, cela explique tout théorie de l'épidémie, et ici - comme toujours, une excellente visualisation de Grant Sanderson).

Le graphe de fonction est quelque chose comme une lettre latine allongée s (ce qui est probablement pourquoi il est aussi parfois appelé la courbe en s ):



Et maintenant, avant de passer directement à la modélisation, il y a un petit spoiler que ce modèle se reflète dans la réalité, et en particulier dans le cas de COVID-19: regardez le tableau des cas d'infection détectés en Chine continentale, tiré d'un projet de l'Université Johns Hopkins :



Nous dérivons notre équation pour COVID-19


Le modèle présenté ci-dessus nécessite la réalisation d'un grand nombre de prérequis, comme une population constante, la possibilité de contact de chacun avec chacun, etc. De plus, avec l'introduction d'un groupe supplémentaire ( R ) au sein de la population qui contient les récupérés / morts (c'est-à-dire qu'ils ne peuvent plus être infectés par le virus), le modèle est encore très fortement lié au nombre initial de personnes infectées.

En réalité, cela n'a aucun sens de dériver un modèle basé sur une seule condition initiale, car dans chaque pays (et même localité) ses propres caractéristiques de propagation du virus - et le nombre total de personnes infectées peut être très différent dans deux régionsje0=1. Rapport uniqueβ pour aider à je0elle s'avère également insuffisante - trop de facteurs influencent la propagation du virus et courbent / cassent la courbe logistique à sa manière.

À cet égard, nous proposons de modifier l'équation du nombre de cas confirmés d'infection virale en maximisant sa paramétrisation:

je(t)=uneb+ce-βt,


Dans ce cas, nous introduisons également le terme dans l'exposant - et ayant 5 paramètres au lieu de 2, nous pouvons certainement affiner la courbe.

Sélection des paramètres


Étant donné que nous disposons de données sur les cas d'infection détectés pour la première njours d'une pandémie, et pas seulement au tout début, c'est-à-dire ensemble de valeurs de cas confirmés(y0,y1,...,yn), nous pouvons réduire le problème de trouver des paramètres optimaux (une,b,c,,β)au problème de minimiser la somme des écarts au carré:

t=1n(yt-je(t))2min


En simplifiant au maximum la tâche, nous avons déterminé l'ensemble final de valeurs pour chacun des paramètres de fonction je(t)et, en fait, nous avons optimisé les hyper-paramètres en recherchant dans la grille la fonction de perte susmentionnée.

Prévisions par pays


Je voudrais souligner que c'est le nombre de cas confirmés de virus qui est prédit, et non le nombre de morts et de récupérés, car après l'infection, le processus de la maladie se déroule de manière très individuelle et tout pronostic sera extrêmement imprécis s'il est basé sur des statistiques générales.

Les données pour les prévisions proviennent du projet GitHub de l'Université Johns Hopkins. La valeur prédite des cas confirmés de virus est donnée comme une fraction de la population du pays multipliée par 10000 (la multiplication est nécessaire pour que les chiffres ne se révèlent pas très petits, sinon l'algorithme prédira simplement des zéros). Le long de l'axeXil y a un certain nombre de jours à partir du moment de l'enregistrement du premier cas d'infection virale.

Les graphiques montrent les cas confirmés au moment (Real Current Confirmed), les valeurs aux mêmes dates, mais prédites par le modèle (Predicted Current Confirmed), et les valeurs prédites pour les 30 prochains jours (Preferred Future Confirmed).

Chine


Le virus a été détecté pour la première fois à Wuhan, la capitale de la province du Hubei. Comme il s'est avéré récemment, le premier cas n'a pas été enregistré fin décembre 2019, comme on le pensait auparavant, mais déjà le 17 novembre . Cela ne change pas l'essence, et grâce aux actions claires du gouvernement chinois dans le domaine de la mise en quarantaine, nous avons réussi fin février à stopper la pandémie locale. Cependant, nous faisons immédiatement une réserve que les données pour le modèle ne sont disponibles qu'à partir du 22 janvier, et à ce moment-là déjà 444 cas ont été enregistrés.


Données sur le premier infecté: 22/01/2020

Italie


La patrie de Paolo Sorrentino est devenue le foyer européen du virus - et cela est dû non seulement à la popularité de l'Italie parmi les touristes chinois (vrai), mais aussi à l'amour particulier des Italiens pour le lavage des mains (une blague).


Données sur le premier infecté: 31/01/2020

Allemagne


La chancelière fédérale Angela Merkel a attiré l'attention de la communauté mondiale avec sa déclaration selon laquelle 70% de la population du pays finirait par contracter le coronavirus .


Données sur les premiers infectés: 27/01/2020

Cependant, selon les prévisions, un peu plus de 0,05% seront affectés

Espagne


Les chauds machos ont décidé de suivre leurs «collègues du climat» (les Italiens, bien sûr) - et jusqu'à présent, il n'y a aucune raison de parler de l'extinction du virus qui se propage bientôt.
Cependant, les Espagnols ne sont pas découragés et proposent peut-être les contrefaçons les plus fascinantes autour du coronavirus - récemment, la nouvelle a glissé qu'un bordel avec 119 personnes a été mis en quarantaine à Valence , dont 86 étaient des clients, en raison du fait que l'un des représentants le coronavirus a été détecté dans la profession la plus ancienne - apparemment, il toussait et un médecin a été trouvé parmi les clients.


Données sur le premier infecté: 01/02/2020

Russie


La situation autour du coronavirus dans notre pays n'est pas encore claire du point de vue de savoir si tous les cas ont été enregistrés - sinon comment expliquer la forte augmentation des cas de pneumonie qui ne peut être distinguée du coronavirus sans recherche supplémentaire?

Mais la façon dont le virus se propage à travers le pays est beaucoup plus intéressante. Sur une page spéciale créée par le centre d'exploitation de Moscou, une liste des vols est maintenueque les malades sont arrivés. Autrement dit, le virus, pour la plupart, est entré dans le pays avec nos compatriotes qui étaient en vacances / travaillant à l'étranger. Si l'on compare le salaire mensuel moyen dans le pays et le coût d'un billet d'avion pour l'Europe, il s'avère que ce ne sont pas les plus pauvres qui ont emporté le virus avec eux. Et puis il est temps de passer à la théorie des graphes, à savoir au concept d' assortiment, ce qui signifie la présence au sein du réseau social (société) de préférences dans les connexions (communication) - en d'autres termes, fondamentalement, les riches communiquent avec les riches et les pauvres avec les pauvres. Au total, il s'avère que pour la Russie, le coronavirus est une maladie des riches. Par conséquent, si vous, mon cher lecteur, êtes actuellement dans le passage souterrain près de la gare de Kazan et que vous tuez en ce moment un rat qui court par votre botte, alors vous faites peut-être partie du groupe le plus sans risque de notre pays.

Cependant, ne vous précipitez pas pour vous réjouir - car il y a une nuance dans la théorie des préférences assorties. Imaginez que l'école ait deux groupes de filles qui communiquent entre elles - belles et laides. Cependant, nous nous souvenons tous que la plus belle fille a une petite amie laide - et maintenant nous avons compris que grâce à cette connexion, une connexion de deux groupes est formée.

Exactement sur le même principe, une femme d'affaires riche qui est revenue d'Italie avec le virus peut avoir une mère à la retraite, qu'elle visite périodiquement, et elle, à son tour, va communiquer avec d'autres retraités dans la cour - c'est ainsi que le virus circule entre strates de la population.


Données sur le premier infecté: 31/01/2020

Selon les prévisions du modèle, la Russie est encore loin du point d'inflexion, c'est-à-dire ce moment dans le temps après lequel l'augmentation des malades par rapport à la veille deviendra de moins en moins.

Sommaire


Bien sûr, le modèle présenté est très basique:

  • il ne prend pas en compte le fait qu'il y a un changement de la température de fond de l'hiver au printemps, et donc que l'activité de propagation du virus devrait diminuer après une augmentation de la température
  • négligence de la fermeture des frontières nationales, mise en place de mesures de quarantaine plus strictes au sein même du pays et, par conséquent, diminution de l'intensité des contacts entre les personnes entre elles
  • : , ; grid search ; , EM- ..

Cependant, si vous êtes intéressé par ce sujet, nous vous conseillons de participer au défi COVID-19 Open Research Dataset Challenge (CORD-19) le plus chaud et de résoudre les problèmes: de l'identification des facteurs de risque à la création d'un vaccin!

Également à partir d'aujourd'hui, nous lançons notre bot dans Telegram (@CoronavirusMonitorBot), dans lequel nous surveillons les informations actuelles sur la situation avec le coronavirus. Nous vous recommandons de vous abonner pour suivre l'évolution de la situation.

La principale chose que je veux dire, c'est qu'il n'y a pas lieu de paniquer. Dans de telles situations, le respect des règles d'hygiène de base et l'évitement des zones surpeuplées aideront à éviter la nature explosive de la propagation du virus. Pour le reste, faites confiance aux mathématiques :)

All Articles