COVID-19: previsão do número de pacientes com coronavírus

O coronavírus finalmente capturou o mundo inteiro - e isso não se expressa no fato de que todos os habitantes do planeta conseguiram obtê-lo. No momento, esse tópico é o principal e o único - tanto no mundo quanto nas notícias russas. Neste artigo, tentaremos abstrair o máximo possível da política e dos argumentos sobre se os militares chineses lançaram o vírus ou Donald Trump. Em vez disso, analisamos o problema de um ponto de vista matemático - a saber, descobriremos como podemos descrever a epidemia com uma equação e, no final do artigo, preveremos o número total de COVID-19 infectado - inclusive na Rússia.



Minuto de Cuidados com OVNI


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, .

, , .

: |

:


Há pouco menos de um século, em 1927, dois cientistas, Kermak e McKendrick, em seu artigo, trouxeram ao mundo a ideia de que a disseminação da epidemia pode ser descrita matematicamente. No caso mais simples, quando uma população de N pessoas está infectada com algum tipo de vírus, e na própria população as pessoas podem estar saudáveis ​​( S ) ou ficar doentes sem a possibilidade de recuperação ( I ), a equação da proporção da população infectada no momento t será parecida com esta:

i(t)=i0i0+(1i0)eβt,


Onde i0representa a proporção inicial de infectados da população total e βresponsável pela propagação da epidemia - e é graças a esse parâmetro que podemos regular a probabilidade de transmissão do vírus de pessoa para pessoa e aumentar / diminuir o zoom quando toda a população for infectada (porque quandot,i(t)1)

Pode parecer para os conhecedores que os caras pegaram emprestada a equação da curva logística do matemático belga Verhulst - no entanto, neste caso, essa equação nada mais é do que o resultado da solução de um sistema de equações diferenciais (não entrarei na selva matemática, mas se alguém estiver interessado, isso explica tudo teoria epidêmica e aqui - como sempre, excelente visualização de Grant Sanderson).

O gráfico da função é algo como uma letra latina alongada s (que é provavelmente o motivo pelo qual também é chamada de curva s ):



E agora, antes de prosseguir diretamente para a modelagem, há um pequeno spoiler de que esse modelo se reflete na realidade, e especificamente no caso do COVID-19: veja o gráfico de casos detectados de infecção na China continental, retirado de um projeto da Universidade Johns Hopkins :



Derivamos nossa equação para COVID-19


O modelo apresentado acima requer o cumprimento de um grande número de pré-requisitos, como uma população constante, a possibilidade de contato de cada um com cada um, etc. Além disso, com a introdução de um grupo adicional ( R ) na população que contém os recuperados / mortos (ou seja, eles não são mais capazes de se infectar com o vírus), o modelo ainda está fortemente vinculado ao número inicial de infectados.

Na realidade, não faz sentido derivar um modelo baseado em apenas uma condição inicial, pois em cada país (e até local) suas próprias características de propagação do vírus - e o número total de infectados pode ser muito diferente em duas regiões comi0=1. Relação únicaβ para ajudar i0também se mostra insuficiente - muitos fatores influenciam a propagação do vírus e dobram / quebram a curva logística à sua maneira.

Nesse sentido, propomos modificar a equação para o número de casos confirmados de infecção por vírus, maximizando sua parametrização:

i(t)=ab+cedβt,


Nesse caso, também introduzimos o termo no expoente - e, com 5 parâmetros em vez de 2, certamente podemos ajustar a curva.

Seleção de parâmetros


Devido ao fato de termos dados sobre casos detectados de infecção pela primeira vez ndias de uma pandemia, e não apenas no início, ou seja, conjunto de valores de casos confirmados(y0,y1,,yn), podemos reduzir o problema de encontrar parâmetros ideais (a,b,c,d,β)ao problema de minimizar a soma dos desvios ao quadrado:

t=1n(yti(t))2min


Simplificando a tarefa o máximo possível, determinamos o conjunto final de valores para cada um dos parâmetros de função i(t)e, de fato, otimizamos os hiper parâmetros pesquisando na grade a função de perda mencionada acima.

Previsões por país


Gostaria de enfatizar que é o número de casos confirmados do vírus que é predito, e não o número de mortos e recuperados, porque após a infecção o processo da doença prossegue de maneira muito individual e qualquer prognóstico será extremamente impreciso se for baseado em estatísticas gerais.

Os dados para a previsão são retirados do projeto GitHub da Universidade Johns Hopkins. O valor previsto dos casos confirmados do vírus é dado como uma fração da população do país multiplicada por 10.000 (é necessária multiplicação para que os números não sejam muito pequenos, caso contrário, o algoritmo irá simplesmente prever zeros). Ao longo do eixoxhá alguns dias a partir do momento do registro do primeiro caso de infecção por vírus.

Os gráficos mostram os casos confirmados no momento (corrente real confirmada), os valores nas mesmas datas, mas previstos pelo modelo (corrente prevista prevista) e os valores previstos para os próximos 30 dias (futuro previsto previsto).

China


O vírus foi detectado pela primeira vez em Wuhan, capital da província de Hubei. Como se viu recentemente, o primeiro caso não foi registrado no final de dezembro de 2019, como se pensava anteriormente, mas já em 17 de novembro . Isso não muda a essência e, graças às ações claras do governo chinês no campo da garantia de quarentena, até o final de fevereiro, conseguimos parar a pandemia local. No entanto, fazemos uma reserva imediata de que os dados para o modelo estão disponíveis apenas a partir de 22 de janeiro e, nessa época, já eram registrados 444 casos.


Dados sobre o primeiro infectado: 22/01/2020

Itália


A pátria de Paolo Sorrentino se tornou o foco europeu do vírus - e isso se deve não apenas à popularidade da Itália entre os turistas chineses (é verdade), mas também ao amor especial dos italianos por lavar as mãos (uma piada).


Dados sobre o primeiro infectado: 31/01/2020

Alemanha


A chanceler Angela Merkel atraiu a atenção da comunidade mundial com sua declaração de que 70% da população do país acabará recebendo o coronavírus .


Dados sobre o primeiro infectado: 27/01/2020

No entanto, de acordo com a previsão, pouco mais de 0,05% será afetado

Espanha


Os machos quentes decidiram acompanhar seus "colegas climáticos" (italianos, é claro) - e até agora não há motivos para falar sobre a extinção do vírus que se espalhará em breve.
No entanto, os espanhóis não estão desanimados e apresentam, talvez, as falsificações mais fascinantes em torno do coronavírus - recentemente surgiram as notícias de que um bordel com 119 pessoas estava em quarentena em Valência , dos quais 86 eram clientes, devido ao fato de um dos representantes o coronavírus foi detectado na profissão mais antiga - aparentemente, tossiu e um médico foi encontrado entre os clientes.


Dados sobre o primeiro infectado: 02/01/2020

Rússia


A situação em torno do coronavírus em nosso país ainda não está clara do ponto de vista de se todos os casos foram registrados - de que outra forma explicar o aumento acentuado nos casos de pneumonia que não podem ser distinguidos do coronavírus sem pesquisas adicionais?

Mas muito mais interessante é como o vírus se espalha pelo país. Em uma página especial criada pelo centro operacional de Moscou, é mantida uma lista de voosque pessoas doentes chegaram. Ou seja, o vírus, na maioria das vezes, entrou no país junto com nossos compatriotas que estavam de férias / trabalhando no exterior. Se compararmos o salário médio mensal no país e o custo de uma passagem aérea para a Europa, acontece que nem as pessoas mais pobres trouxeram o vírus com elas. E então é hora de recorrer à teoria dos grafos, ou seja, ao conceito de sortimento, que significa a presença na rede social (sociedade) de preferências nas conexões (comunicação) - em outras palavras, basicamente os ricos se comunicam com os ricos e os pobres com os pobres. No total, verifica-se que, para a Rússia, o coronavírus é uma doença de pessoas ricas. Portanto, se você, meu querido leitor, está atualmente na passagem subterrânea do metrô perto da estação de Kazan e agora está matando um rato correndo pela bota, talvez faça parte do grupo mais livre de riscos em nosso país.

No entanto, não se apresse para se alegrar - porque há uma nuance na teoria das preferências sortidas. Imagine que a escola tenha dois grupos de meninas se comunicando - bonitos e feios. No entanto, todos nos lembramos que a garota mais bonita tem uma namorada feia - e agora percebemos que através dessa conexão é formada uma conexão de dois grupos.

Exatamente no mesmo princípio, uma mulher de negócios rica que retornou da Itália com o vírus pode ter uma mãe aposentada, a quem ela visita periodicamente e, por sua vez, vai se comunicar com outros pensionistas no quintal - é assim que o vírus flui entre estratos da população.


Dados sobre o primeiro infectado: 31/01/2020

De acordo com as previsões do modelo, a Rússia ainda está longe do ponto de inflexão, ou seja, aquele momento em que o aumento do número de doentes em relação ao dia anterior se tornará cada vez menor.

Sumário


Obviamente, o modelo apresentado é muito básico:

  • não leva em conta o fato de que há uma mudança no cenário de temperatura do inverno para a primavera e, portanto, a atividade de propagação do vírus deve cair após um aumento na temperatura
  • negligência do fechamento das fronteiras do estado, o estabelecimento de medidas mais rigorosas de quarentena dentro do próprio país e, como resultado, uma diminuição na intensidade do contato entre as pessoas entre si
  • : , ; grid search ; , EM- ..

No entanto, se você estiver interessado neste tópico, recomendamos que você participe do desafio mais quente do conjunto de dados de pesquisa aberta COVID-19 (CORD-19) e resolva problemas: da identificação de fatores de risco à criação de uma vacina!

Também a partir de hoje, lançamos nosso bot no Telegram (@CoronavirusMonitorBot), no qual monitoramos as informações atuais sobre a situação com o coronavírus. Recomendamos que você se inscreva para ficar a par de como a situação se desenvolverá.

A principal coisa que quero dizer é que não há necessidade de entrar em pânico. Nessas situações, observar as regras básicas de higiene e evitar áreas lotadas ajudará a evitar a natureza explosiva da propagação do vírus. Quanto ao resto, conte com a matemática :)

All Articles