COVID-19: prediciendo el número de pacientes con coronavirus

El coronavirus finalmente capturó el mundo entero, y esto no se expresa en el hecho de que todos los habitantes del planeta lograron obtenerlo. Por el momento, este tema es el principal y el único, tanto en el mundo como en las noticias rusas. En este artículo, trataremos de abstraer lo más posible de la política y los argumentos sobre si el ejército chino lanzó el virus o Donald Trump. En cambio, miramos el problema desde un punto de vista matemático, es decir, descubriremos cómo podemos describir la epidemia con una ecuación, y al final del artículo predeciremos el número total de COVID-19 infectados, incluso en Rusia.



Minuto de atención ovni


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, , .

: |

:


Incluso hace poco menos de un siglo, en 1927, dos científicos, Kermak y McKendrick, en su artículo trajeron al mundo la idea de que la propagación de la epidemia puede describirse matemáticamente. En el caso más simple, cuando una población de N personas está infectada con algún tipo de virus, y en la población misma las personas pueden estar sanas ( S ) o enfermarse sin la posibilidad de recuperación ( I ), la ecuación de la proporción de población infectada en el momento t se verá así:

i(t)=i0i0+(1i0)eβt,


Dónde i0representa la proporción inicial de infectados de la población total, y βresponsable de la propagación de la epidemia, y es gracias a este parámetro que podemos regular la probabilidad de transmisión del virus de persona a persona y acercar / alejar el momento en que toda la población se infecta (porque cuandot,i(t)1)

Puede parecerles a los entendidos que los chicos tomaron prestada la ecuación de la curva logística del matemático belga Verhulst; sin embargo, en este caso, esta ecuación no es más que el resultado de resolver un sistema de ecuaciones diferenciales (no entraré en la jungla matemática, pero si alguien está interesado, esto lo explica todo teoría epidémica, y aquí , como siempre, gran visualización de Grant Sanderson).

El gráfico de función es algo así como una letra latina alargada s (que probablemente sea por eso que a veces también se la llama curva s ):



Y ahora, antes de proceder directamente al modelado, hay un pequeño spoiler de que este modelo se refleja en la realidad, y específicamente en el caso de COVID-19: mire la tabla de casos detectados de infección en China continental, tomada de un proyecto de la Universidad Johns Hopkins :



Derivamos nuestra ecuación para COVID-19


El modelo presentado anteriormente requiere el cumplimiento de una gran cantidad de requisitos previos, como una población constante, la posibilidad de contacto de cada uno con cada uno, etc. Además, con la introducción de un grupo adicional ( R ) dentro de la población que contiene los recuperados / muertos (es decir, ya no pueden infectarse con el virus), el modelo sigue estando muy vinculado al número inicial de infectados.

En realidad, no tiene sentido derivar un modelo basado en una sola condición inicial, ya que en cada país (e incluso localidad) sus propias características de propagación del virus, y el número total de infectados puede ser muy diferente en dos regiones coni0=1. Relación únicaβ para ayudar a i0también resulta insuficiente: demasiados factores influyen en la propagación del virus y doblan / rompen la curva logística a su manera.

En este sentido, proponemos modificar la ecuación para el número de casos confirmados de infección por virus maximizando su parametrización:

i(t)=ab+cedβt,


En este caso, también introducimos el término en el exponente, y teniendo 5 parámetros en lugar de 2, ciertamente podemos ajustar la curva.

Selección de parámetros.


Debido al hecho de que tenemos datos sobre casos detectados de infección para el primer ndías de una pandemia, y no solo al comienzo, es decir conjunto de valores de casos confirmados(y0,y1,,yn), podemos reducir el problema de encontrar parámetros óptimos (a,b,c,d,β)al problema de minimizar la suma de desviaciones al cuadrado:

t=1n(yti(t))2min


Simplificando la tarea tanto como sea posible, determinamos el conjunto final de valores para cada uno de los parámetros de la función i(t)y, de hecho, optimizamos los hiperparámetros buscando en la cuadrícula la función de pérdida mencionada anteriormente.

Pronósticos del país


Me gustaría enfatizar que se predice el número de casos confirmados del virus, y no el número de muertos y recuperados, porque después de la infección el proceso de la enfermedad se desarrolla de manera muy individual, y cualquier pronóstico será extremadamente inexacto si se basa en estadísticas generales.

Los datos para el pronóstico se toman del proyecto GitHub de la Universidad Johns Hopkins. El valor predicho de los casos confirmados del virus se da como una fracción de la población del país multiplicada por 10,000 (la multiplicación es necesaria para que los números no sean muy pequeños, de lo contrario el algoritmo simplemente predecirá ceros). A lo largo del ejextranscurren varios días desde el momento del registro del primer caso de infección por virus.

Los gráficos muestran los casos confirmados en este momento (Corriente real confirmada), los valores en las mismas fechas, pero pronosticados por el modelo (Corriente pronosticada confirmada) y los valores pronosticados para los próximos 30 días (Futuro futuro confirmado).

China


El virus se detectó por primera vez en Wuhan, la capital de la provincia de Hubei. Como resultó recientemente, el primer caso no se registró a fines de diciembre de 2019, como se pensaba anteriormente, pero ya el 17 de noviembre . Esto no cambia la esencia, y gracias a las acciones claras del gobierno chino en el campo de garantizar la cuarentena, a fines de febrero logramos detener la pandemia local. Sin embargo, inmediatamente hacemos una reserva de que los datos para el modelo están disponibles solo desde el 22 de enero, y para ese momento ya se habían registrado 444 casos.


Datos sobre el primer infectado: 22/01/2020

Italia


La patria de Paolo Sorrentino se ha convertido en un caldo de cultivo europeo para el virus, y esto se debe no solo a la popularidad de Italia entre los turistas chinos (cierto), sino también al amor especial de los italianos por lavarse las manos (broma).


Datos sobre el primer infectado: 31/01/2020

Alemania


La canciller Angela Merkel atrajo la atención de la comunidad mundial con su declaración de que el 70 por ciento de la población del país eventualmente contraerá coronavirus .


Datos sobre el primer infectado: 27/01/2020

Sin embargo, según el pronóstico, un poco más del 0.05% se verá afectado

España


Los machos calientes decidieron mantenerse al día con sus "colegas climáticos" (italianos, por supuesto), y hasta ahora no hay razón para hablar sobre la extinción del virus que se está extendiendo pronto.
Sin embargo, los españoles no se desaniman y se les ocurren, quizás, las falsificaciones más fascinantes en torno al coronavirus: recientemente se corrió la noticia de que un burdel con 119 personas estaba en cuarentena en Valencia , de las cuales 86 eran clientes, debido a que uno de los representantes El coronavirus se detectó en la profesión más antigua, aparentemente tosió y se encontró un médico entre los clientes.


Datos sobre el primer infectado: 01/02/2020

Rusia


La situación en torno al coronavirus en nuestro país aún no está clara desde el punto de vista de si se han registrado todos los casos, ¿de qué otra manera explicar el fuerte aumento en los casos de neumonía que no pueden distinguirse del coronavirus sin una investigación adicional?

Pero mucho más interesante es cómo se propaga el virus en todo el país. En una página especial creada por el centro operativo de Moscú, se mantiene una lista de vuelosque llegaron los enfermos. Es decir, el virus, en su mayor parte, ingresó al país junto con nuestros compatriotas que estaban de vacaciones / trabajando en el extranjero. Si comparamos el salario mensual promedio en el país y el costo de un boleto aéreo a Europa, resulta que no las personas más pobres trajeron el virus con ellos. Y luego es hora de pasar a la teoría de grafos, es decir, al concepto de surtido, lo que significa la presencia dentro de la red social (sociedad) de preferencias en las conexiones (comunicación); en otras palabras, básicamente los ricos se comunican con los ricos y los pobres con los pobres. En total, resulta que para Rusia, el coronavirus es una enfermedad de las personas ricas. Por lo tanto, si usted, mi querido lector, se encuentra actualmente en el paso subterráneo cerca de la estación de tren de Kazan y en este momento está matando a una rata que corre por su bota, entonces quizás sea parte del grupo más libre de riesgos en nuestro país.

Sin embargo, no se apresure a alegrarse, porque hay un matiz en la teoría de las preferencias surtidas. Imagine que la escuela tiene dos grupos de niñas que se comunican entre sí: hermosas y feas. Sin embargo, todos recordamos que la niña más hermosa tiene una novia fea, y ahora entendemos que a través de esta conexión se forma una conexión de dos grupos.

Exactamente según el mismo principio, una mujer de negocios rica que regresó de Italia con el virus puede tener una madre jubilada, a quien visita periódicamente y, a su vez, se comunica con otros pensionistas en el patio: así es como fluye el virus entre estratos de la población.


Datos sobre el primer infectado: 31/01/2020

Según las previsiones del modelo, Rusia todavía está lejos del punto de inflexión, es decir. ese momento en el tiempo después del cual el aumento de los enfermos en comparación con el día anterior será cada vez menor.

Resumen


Por supuesto, el modelo presentado es muy básico:

  • no tiene en cuenta el hecho de que hay un cambio en la temperatura de fondo de invierno a primavera y, por lo tanto, la actividad de propagación del virus debería caer después de la temperatura
  • descuido del cierre de las fronteras estatales, el establecimiento de medidas de cuarentena más estrictas dentro del propio país y, como resultado, una disminución en la intensidad del contacto entre las personas entre sí
  • : , ; grid search ; , EM- ..

Sin embargo, si está interesado en este tema, le recomendamos que se una al COVID-19 Open Research Dataset Challenge (CORD-19) y resuelva problemas: ¡desde la identificación de factores de riesgo hasta la creación de una vacuna!

También desde hoy lanzamos nuestro bot en Telegram (@CoronavirusMonitorBot), en el que monitoreamos la información actual sobre la situación con coronavirus. Recomendamos que se suscriba para mantenerse al tanto de cómo se desarrollará la situación.

Lo principal que quiero decir es que no hay necesidad de entrar en pánico. En tales situaciones, observar las reglas básicas de higiene y evitar las zonas abarrotadas ayudará a evitar la naturaleza explosiva de la propagación del virus. Por lo demás, confíe en las matemáticas :)

All Articles