Pourquoi est-il si difficile de construire un bon modèle de distribution COVID-19?



Et nous voici, pendant la pandémie, nous regardons par nos fenêtres, comme des poissons d'aquarium. Tout le monde pense à une chose: à quel point cela se terminera-t-il? Et immédiatement la deuxième pensée: sérieusement, combien de temps devrais-je vivre dans un espace aussi exigu?

Nous avons tous besoin de réponses. Compte tenu de la quantité de recherches et de données collectées sur le nouveau coronavirus, il semble que les réponses doivent simplement apparaître.

Et il y a vraiment des réponses. Le problème est qu'il y a une déchirure en eux . Par exemple, les Centers for Disease Control and Prevention des États-Unis utilisent des modèles qui, à en juger par les prédictions dont, dans le meilleur des cas, 200 000 Américains meurent du virus. Pendant ce temps, un rapport de l' Imperial College de Londres a fait la une des journaux avec son terrible scénario, selon lequel 2,2 millions d'Américains mourront si personne ne change leur comportement quotidien.

UFO Care Minute


La pandémie COVID-19, une infection respiratoire aiguë potentiellement grave causée par le coronavirus SARS-CoV-2 (2019-nCoV), a été officiellement annoncée dans le monde. Il y a beaucoup d'informations sur Habré sur ce sujet - rappelez-vous toujours qu'il peut être à la fois fiable / utile, et vice versa.

Nous vous invitons à critiquer toute information publiée.


Sources officielles

, .

Lavez-vous les mains, prenez soin de vos proches, restez à la maison dans la mesure du possible et travaillez à distance.

Lire les publications sur: coronavirus | travail à distance

C'est, pour le moins, une putain de dispersion - à peu près la même qu'entre le nombre de personnes qui meurent de blessures et de violence chaque année et le nombre de personnes qui meurent lorsque les communistes chinois ont réprimé le soulèvement contre-révolutionnaire de 1950 à 1953 [l'auteur, apparemment, a eu la guerre de Corée avec les Chinois guerre civile / env. trad.]. En d'autres termes, la différence entre la vie quotidienne et les événements qui la changeront à jamais.

D'où vient donc un écart aussi important? Telle est, mes chers, la nature de la modélisation de cette bête. L'utilisation d'un modèle mathématique pour prédire l'avenir est un outil utile pour les experts, même lorsqu'il existe un écart entre les résultats possibles. Cependant, il n'est pas toujours facile de comprendre les résultats et comment ilschanger avec le temps , et cette confusion peut nuire à la fois à votre esprit et à vos sentiments. Par conséquent, nous devons parler de ce qui est inclus dans le modèle de pandémie. Peut-être que la compréhension de l'incertitude vous aidera à trier tous ces chiffres.

Imaginez un modèle mathématique simple prédisant le résultat de la propagation du coronavirus. C'est assez simple à construire - c'est le genre de chose que nos employés font pendant les téléconférences. Le nombre de personnes décédées du virus est fonction du nombre de personnes qui peuvent être infectées, de la vitesse de sa propagation et du pourcentage de personnes que le virus peut tuer. Autrement dit, en d'autres termes (mathématiques):





N() = N( ) * _ * _

Assez simple. Jusqu'à ce que vous essayiez de remplir les données manquantes. Ensuite, il s'avère qu'aucun endroit ne peut être mis un chiffre spécifique. Chaque valeur dépend de choix différents et d'un manque de connaissances. Et si chaque élément du modèle fluctue, l'ensemble du modèle aura les mêmes problèmes afin de rester stable, comme un journaliste écrivant sur les données après une téléconférence trop longue pendant l'auto-isolement.

Considérez une chose aussi fondamentale que la saisie de données. Différents pays et régions collectent des données de plusieurs manières. Il n'y a pas de feuille de calcul unique qui serait remplie à la fois et qui nous permettrait de comparer facilement le nombre de maladies et de décès dans le monde. Même aux États-Unis, les médecins disent que le nombre de décès dus au COVID-19 est sous-estimé.

Les mêmes incohérences s'appliquent aux tests de virus. Certains pays testent tous ceux qui le souhaitent. Dans d' autres, non . Cela affecte notre connaissance du nombre de personnes qui ont réellement reçu du COVID-19 et du nombre de personnes qui l'ont trouvé.

De plus, le virus lui-même agit de façon imprévisible, nuisant à certains groupes plus qu'à d'autres - la démographie locale et la santé publique détermineront en grande partie l'issue de l'impact du virus sur la communauté.

"Nous, les personnes impliquées dans les soins de santé, travaillons parfois avec un manque d'informations, essayant de faire les meilleures estimations sur la base d'informations très incomplètes", a déclaré Bill Miller, professeur d'épidémiologie à l'Ohio State University.

Taux de mortalité




Certaines personnes meurent de COVID-19. Et ce sera probablement notre dernière déclaration inconditionnelle. Cependant, «certains» n'est pas un nombre, et vous ne pouvez pas y construire des mathématiques.

Le problème est que le calcul du pourcentage de décès dus au virus dès le début est inexact. Dans différents groupes, cela peut être très différent. "L'âge est un facteur très important, nous devons donc raconter les décès en tenant compte de la composition démographique des États-Unis et de la présence de maladies chroniques", a déclaré Ray Wannier, biostatist à l'Université de Californie à San Francisco. Les maladies chroniques peuvent exacerber les effets de COVID-19.

En d'autres termes, il n'y a pas de taux de mortalité unique - ils sont nombreux. Le taux de mortalité aux États-Unis varieradu taux de mortalité dans un pays où, par exemple, moins de patients atteints de diabète. On peut dire la même chose des coefficients aux États-Unis - si le virus se propage dans la ville avec les banlieues où vivent les personnes âgées, le taux de mortalité calculé y sera plus élevé que si le centre de distribution était dans la ville avec la population jeune.

Mais passons aux statistiques internationales. Le taux de mortalité par COVID-19 en Chine ou en Italie nous permettra-t-il d'estimer le taux de mortalité aux USA? Certes, cette information sera utile - mais elle ne fera que réduire l'incertitude et ne donnera pas une certitude complète.

Bien sûr, nous ne connaissons toujours pas les taux de mortalité exacts dans ces régions. Pour de nombreuses raisons, à commencer par un ensemble de données de base sur les cas. Les chiffres ne sont pas des faits. C'est le résultat de nombreuses conclusions subjectives, qui doivent d'abord être rédigées en détail et de manière transparente, puis commencer à être considérées comme un fait. Cela affecte la façon dont les données sont collectées et si le processus de collecte change de temps en temps.

Il y a aussi le problème des données non collectées ou inexactes. Pour déterminer le taux de mortalité, vous devez diviser le nombre de personnes décédées de la maladie par le nombre de cas. Mais nous n'avons pas de chiffres exacts pour les personnes malades - mathématiquement parlant, nous ne connaissons pas le dénominateur. Et franchement, le premier nombre, le numérateur, n'est pas non plus exactement connu de nous - cependant, nous supposons qu'il est proche de la réalité.


« » COVID-19. - , , .

Dans un monde idéal, nous vérifierions toutes les personnes pour des signes d'infection par un nouveau coronavirus, pour savoir exactement combien de personnes en sont atteintes et combien sont décédées à cause de cela. Cependant, nous sommes arrivés à cette situation dans quelques cas seulement. Prenons, par exemple, le Diamond Princess, l'un des navires de croisière mis en quarantaine après le déclenchement de COVID-19. Presque tous les passagers ont réussi les tests (3063 tests pour 3711 personnes). Le «Diamond Princess» est devenu un laboratoire vivant, avec des conditions de collecte de données qui ne s'additionnent généralement pas dans le monde réel. Les chercheurs ont pu non seulement savoir combien de personnes étaient malades, mais combien n'avaient aucun symptôme - et donc, combien de personnes ne seraient pas testées, ne seraient pas diagnostiquées et ne seraient pas prises en compte si elles étaient à terre.

Les résultats de cette expérience inhabituelle indiquent l'existence d'un grand nombre de personnes porteuses du virus et ne le savent pas - et, par conséquent, que le taux de mortalité est en réalité inférieur à ce qui ressort des données. Parmi la population du Diamond Princess, le taux de mortalité des personnes ayant un diagnostic et des symptômes était de 2,3%, cependant, si tous les diagnostics étaient pris en compte - même pour ceux qui ne présentaient pas de symptômes - alors le coefficient serait de 1,2% . En Islande, le 13 mars, deCODE Genetics a commencé à offrir des tests gratuits pour tout le monde, même les personnes sans symptômes. Le 29 mars, deCODE a détecté 71 personnes infectées dans 8694 tests, y compris celles sans symptômes.

Pendant ce temps, le ratio de symptômes - le nombre de personnes présentant des symptômes par rapport au nombre de personnes sans - est également d'une grande importance, mais en même temps, nous ne pouvons que le deviner. Un rapport de l' Imperial College de Londres suggère que les deux tiers des cas sont suffisamment symptomatiques pour qu'une personne infectée se sente et s'auto-isole. Dans les données de la "Diamond Princess", il a été constaté qu'au moment du diagnostic, des symptômes étaient apparus chez la moitié des personnes . Le rapport de symptômes réel affecte le calcul du taux de mortalité.

Cependant, les données du "Diamond Princess" sont également imparfaites - elles n'ont pas vérifié tout le monde, la section démographique des passagers du bateau de croisière n'est pas représentative d'une population plus large, et certains patients peuvent encore mourir, ce qui augmentera le taux de mortalité. Cependant, aucune donnée plus réaliste ne peut être trouvée sur terre. Les données de l'Islande ne sont pas publiées avec les mêmes détails méthodologiques. Aux États-Unis, les tests à grande échelle ne font que commencer. Si seules les personnes malades sont testées, comme c'est le cas dans la plupart des États, le taux de mortalité ne reflétera pas le comportement réel du virus - le problème du dénominateur relève à nouveau la tête. De plus, les tests aux États-Unis sont confrontés à des défis supplémentaires - le manque de tests et le fait que certains laboratoires privés ne publient pas le nombre de résultats négatifs.

Le véritable taux de mortalité est également affecté par notre capacité à empêcher un malade de mourir. Et cela dépend des capacités des hôpitaux. Avec un accès illimité aux lits de soins intensifs et à la ventilation mécanique, de nombreuses personnes présentant des symptômes graves pourraient survivre à l'infection. Mais aux États-Unis, il n'y a pas assez de ressources, et si la demande dépasse l'offre - comme cela se produit déjà dans certaines parties du pays - alors les personnes qui survivraient en accédant au ventilateur mourraient. Cela peut conduire à un effet domino. Les personnes qui ont besoin de soins d'urgence non liés au virus souffriront également d'un manque de ressources dans les hôpitaux, et leur décès, même pas lié à COVID-19, s'ajoutera aux statistiques globales de mortalité, bien qu'ils auraient pu être évités et bien qu'ils ne devraient pas être inclus statistiques sur COVID-19.

«La mortalité sera grandement affectée par une pénurie de fournitures et de personnel, et la flexibilité de notre système de soins de santé n'est pas encore claire», a déclaré Wagnier.

Et il y a aussi un taux d'infection




Presque tout ce dont nous avons parlé sur le taux de mortalité est également applicable au taux d'infection: toutes les estimations dépendent de la collecte de données, de l'échantillonnage et du taux symptomatique. Mais pour connaître le taux d'infection, vous devez toujours comprendre à quelle fréquence le virus est transmis d'une personne à une autre. Vous avez peut-être entendu un terme tel que le nombre reproducteur de base (abrégé en R 0 ) - c'est le nombre moyen d'infections secondaires qui surviennent après qu'un individu infecté se trouve dans une population composée d'individus qui sont complètement sensibles à cette maladie.

Voici la chose: la transmission du virus fluctuera sûrement énormément et dépendra de diverses caractéristiques du comportement social, des détails de l'environnement local et des décisions politiques. Dans différents pays, tout cela sera différent. Et même dans différents États des États-Unis. De plus, ces paramètres changeront avec le temps en fonction des mesures que nous prenons pour lutter contre le virus. Dans le cas du paludisme , par exemple, R 0 est plus élevé dans les endroits où il y a beaucoup d'eau stagnante.

Pour cette raison, la modélisation des résultats de distribution potentiels pour COVID-19 doit inclure de nombreux scénarios de transmission de virus différents. Et ils ne seront pas exacts; ce sera une certaine fourchette de notes. Dans ces scénarios, plusieurs estimations sont prises en compte, chacune pouvant à son tour également changer (sérieusement, ce n'est qu'une régression sans fin).

La première variable est le coefficient de contact - en fait, avec combien de personnes la personne infectée interagit avec pendant une certaine période de temps. Seul ce paramètre est soumis aux personnes, et c'est pourquoi tout le monde est enfermé et parle de distance sociale. Le coefficient de contact moyen est hétérogène - il varie d'une personne à l'autre, en fonction de facteurs tels que la situation de l'habitat et du travail, et varie également en fonction de la façon dont le système de santé réagit et où tout se passe. "Imaginez la différence entre les hauts plateaux d'un État rural et le quartier des affaires d'une grande ville", a déclaré Miller.

Vient ensuite le rapport de démultiplication. C'est une façon d'imaginer le nombre de personnes infectées en rencontrant une personne infectée. C'est également une cible mouvante. Les virus ne se propagent pas selon un schéma uniforme tel que «deux nouveaux cas par personne». Le processus se déroule en sauts irréguliers, comme une foule de résidents de banlieue qui se jettent sur les étagères avec du papier toilette. Sam Scarpino, professeur à l'Université du Nord-Est qui modélise les maladies infectieuses, appelle cela des «événements de super-prolifération» - des situations où un facteur qui dépend généralement plus du site d'action que des personnes augmente soudainement le nombre de cas. Rappelez-vous la conférence Biogen, qui à un moment donné était responsablepour 77 des 95 cas diagnostiqués dans le Massachusetts. Ou une femme qui a rompu à elle seule une stratégie de confinement efficace en Corée du Sud.

Rappelez-vous le rapport des symptômes? Certains suggèrent que les porteurs présentant des symptômes infectent moins de personnes que ceux qui n'en présentent pas, ce ratio affecte donc également le taux de transmission.

La virologie est également importante lors du recomptage du nombre de transferts aux contacts. Ici, vous devez considérer combien de temps le virus peut survivre à la surface (et sur quelles surfaces il apparaît), et jusqu'à quelle distance il peut voler dans l'air. Avec le nouveau COVID-19, il existe différentes notes pour les deux facteurs.. Il existe toujours une différence entre le corps et le comportement humain. Par exemple, les fumeurs peuvent être plus à risque d'infection et de complications. Et bien que cela soit en grande partie dû à l'effet du tabagisme sur les poumons et à ce que le virus fait à l'intérieur du corps, cela affecte également le fait que les fumeurs mettent souvent les mains à la bouche , augmentant le risque de transmission.

Enfin, il y a la durée de la contagion - combien de temps une personne peut-elle propager le virus et pendant quelle période de développement de la maladie est- elle contagieuse ? Cela dépend de la biologie du virus et des systèmes immunitaires individuels, a déclaré Mark Weir, directeur du programme environnemental, d'épidémiologie et de santé de l'Ohio State University.

Tous ces paramètres sont utilisés pour estimer R 0, nombre reproducteur de base.

Et si le nombre reproductif de base implique la vulnérabilité de l'ensemble de la population, il existe alors un nombre reproductif efficace, selon le pourcentage de la population vulnérable au virus. L'une des raisons de la grande vulnérabilité de la population au nouveau coronavirus est que ce virus est exactement ce qui est nouveau. Personne ne l'avait avant.

En outre, un bon modèle doit penser à un problème tel que la réinfection: si les personnes qui ont reçu le virus et s'en sont rétablies acquièrent une immunité, le pourcentage de la population vulnérable est réduit. Mais jusqu'à présent, nous ne savons pas grand-chose sur l'immunité après l'infection .

Et nous n'avons même pas évoqué ce changement de vulnérabilité lors de l'ouverture d'un vaccin. Mais nous avons déjà suffisamment de détails.

Mélangez le tout dans un modèle


Pour créer un modèle, vous devez collecter toutes ces variables (et d'autres dont l'éditeur ne nous a pas permis de parler), prendre en compte leur incertitude, leur corrélation conjointe et bien d'autres choses. Cela peut s'avérer être une chose assez compliquée.

Et tous ces facteurs peuvent être influencés par toutes les tentatives pour interférer avec la propagation du virus - distance sociale, se laver les mains, fermer les écoles, réduire le nombre d'opérations chirurgicales non urgentes, etc. Il s'agit d'une grande inconnue, capable de changer radicalement la forme de l'épidémie - et elle varie également en fonction du pays, de l'État et même de la ville.



C'est comme faire une tarte. Avec une recette normale, cela peut être fait assez simplement et s'attendre à un résultat significatif et prévisible. Mais si la recette contient des instructions comme «ajouter de trois à 15 pommes, ou des steaks, ou des tranches de choux de Bruxelles, selon ce que vous avez sous la main» ... cela affectera certainement le goût de la tarte, non? Vous pouvez faire des hypothèses sur l'exactitude des ingrédients et leur quantité. Mais ce ne sont que des hypothèses, pas des faits exacts. Et si vous faites trop d'hypothèses lors de la cuisson, vous n'obtiendrez peut-être pas ce que vous vouliez faire. Et vous ne savez pas nécessairement que vous vous êtes trompé.

Au cours des prochains mois, vous rencontrerez de nombreuses prévisions différentes concernant l'issue de la pandémie de COVID-19. Tous ne seront pas identiques. Mais ce n'est pas parce qu'ils sont basés sur des hypothèses qu'ils sont inutiles.

"Tous les modèles sont faux, nous nous efforçons de les rendre moins faux et utiles aujourd'hui", a déclaré Weir.

Nous voulons manger, donc quelqu'un devra faire la cuisine. Assurez-vous de demander de quels ingrédients et de quelle quantité ce gâteau a été fait.

All Articles