Exame dos dados de proliferação de COVID-19 usando diferenças de primeira ordem. E o que veio disso

Oi Habr. A ideia surgiu com a ideia de analisar dados usando diferenças. O método não é novo, mas a essência da ideia é investigar não os valores absolutos dos dados de distribuição, mas a participação do agente (país) no conjunto total de agentes (todos os países). E o comportamento dessa participação no processo da epidemia.

Na Figura 1, ele apresentou todos os pontos estudados (quase 24.000, dados do Centro Europeu de Prevenção e Controle de Doenças ), por isso é um pouco enlameado e destacou linhas de aproximação para os países que mostram claramente seu caráter com equações de regressão e o coeficiente R ^ 2 .


FIG. 1

Minuto de Cuidados com OVNI


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, .

, , .

: |

Nas figuras, sob o spoiler, ele apresentou dados de países selecionados em duas versões, quando são examinadas a mudança na participação do agente e os dados reais sobre o crescimento de pessoas infectadas. Com um pouco de análise gráfica. Em geral, pode-se dizer que o método da diferença nessa interpretação pode funcionar como um indicador principal auxiliar dos processos de desenvolvimento da pandemia, algo como indicadores na análise técnica das taxas de câmbio.

Gráficos

. 2.


. 3.


. 4.


. 5.


. 6.

Base teórica


Apresentarei as informações iniciais sobre o mecanismo do indicador no início com um exemplo simples de um exemplo real.

Pegue um grupo local de três países (Rússia, Irã, EUA) pelo período de 22 de abril de 23 (Figura 7).

1a) No Irã, o número de pessoas infectadas em 22/04/2020 era de 84.802.
1b) No Irã, o número de pessoas infectadas em 23 de abril de 2020 era de 85.996.
2a) Na Rússia, em 22 de abril de 2020, o número de pessoas infectadas era de 52.763 pessoas.
2b) Na Rússia, o número de pessoas infectadas em 23 de abril de 2020 era de 57.999.
3a) Nos Estados Unidos, o número de pessoas infectadas em 22 de abril de 2020 era de 825041 pessoas.
3b) Nos EUA, o número de pessoas infectadas em 23/04/2020 era de 842629 pessoas.
4a) O número total de pessoas infectadas, em um conjunto de três países, em 22.04.2020 - 962606 pessoas.
4b) O número total de pessoas infectadas, em um conjunto de três países, em 23/04/2020 - 986624 pessoas.


FIG. 7.

Fundamentação matemática.

Indique o número total de infectados na etapa (a partir da data) i - Ni.
Indique o número total de pessoas infectadas no país j na data i = Mji.
Então a função em estudo tem a forma:
Fji = Mji / Ni O
incremento da função dFji tem a forma:



Esta função possui uma importante propriedade de equilíbrio, que é a soma de todas as diferenças em cada etapa (em cada data) é 0. Além disso, a justificativa matemática.



A segunda consequência dessa lei do equilíbrio é que a soma de todas as diferenças ao longo de todo o processo de desenvolvimento e a vida da epidemia também é zero. A matemática está abaixo.



Essas diferenças têm três estados:

A) Menor que zero;
B) é 0;
C) Mais que zero.

Sua interpretação segue as regras padrão para o estudo de funções e, aqui, não sobrecarregarei esses aspectos.

Considere o comportamento de um gráfico de uma função no infinito. Lembramos que os princípios modernos dizem que hoje não somos capazes de erradicar o vírus, mas podemos apenas tentar elevar a incidência por esse motivo a um nível aceitável. Ou seja, em algum lugar no futuro haverá um estado de equilíbrio de acordo com as condições:
Mji + 1 = Mji + dj

Ou seja, para a progressão aritmética, assumindo-se que o crescimento (alfa) do número total de pessoas infectadas seja superior a 1, obtemos:



Isso é claramente visível no gráfico para a China.


Fig. 12.

Do exposto, a seguinte propriedade é formada. Que este modelo possa ser estável na presença de explosões locais em um ou parte de agentes (países).

Nós raciocinamos da seguinte maneira. No processo de desenvolvimento de uma pandemia, cada país acabará entrando no estágio quando as diferenças subsequentes se aproximarem de zero do lado negativo. O número desses países aumentará e, idealmente, se aproximará do número de k-1. Mas não pode haver mais disso, pois a equação do balanço deve ser observada. Em k-1, a soma total das diferenças na i-ésima etapa será menor que zero. E então o k-ésimo país deve ter um valor de diferença maior que zero, para que o saldo final seja zero. Isso é uma onda. Na etapa i + 1, o k-ésimo país reduz sua diferença e move-se no gráfico para o semiplano negativo. Mas isso só é possível se houver um aumento em um ou mais países que estavam anteriormente na zona negativa. É o que todos vemos nos surtos sazonais de gripe,que deve obedecer às mesmas leis.

Avaliando a complexidade da tarefa, a primeira coisa que vem à mente é o “problema dos três corpos”, mas existem 206. É teoricamente possível, mas não claro, qual sistema de equações diferenciais terá que ser resolvido. Mas, por outro lado, o sistema de equações diferenciais implica parâmetros iniciais, e já temos muitos desses parâmetros. Dado o fato de que o intervalo de valores das funções é de -1 a +1 e o sistema de desvios implica muitas zonas mortas. De acordo com o modelo construído, o valor do saldo devido a erros nos cálculos divergiu de zero por 1 * 10 ^ -17. Ou seja, o intervalo dos valores estudados é 2 * 10 ^ 17. Suponho que tais condições tornem possível projetar e treinar uma rede neural, que pode ser mais rápida. Felizmente, o modelo é escalado por cidade para cada país; como resultado, amostras de treinamento podem ser encontradas o suficiente.

Bem, um pouco de mosca neste modelo.

Quando analisei o saldo de agentes, descobri que as diferenças acumuladas se comportam da seguinte maneira, como na figura abaixo para a China.


Fig. 13.

A figura mostra que a China assume toda a massa negativa. A exclusão da China recebeu um cronograma semelhante, mas a Tailândia assumiu a massa negativa. Minha hipótese sobre essa propriedade é a seguinte. Até o momento, o modelo inalterado de número de agentes (países) reflete processos internos. No estágio em que um novo agente é adicionado (ou seja, um agente infectado foi detectado em outro país), o sistema captura o último estado do estágio anterior e esse se torna o parâmetro inicial do próximo.

Resumindo em geral, pode-se supor que esse modelo possa ser usado como indicador principal da disseminação de uma pandemia e processos similares, como a distribuição de determinados produtos, especialmente na Internet. Em um nível intuitivo, ele propôs para si uma hipótese de que alguns indicadores da análise técnica poderiam ser corrigidos. Também considerarei a hipótese de esclarecer o método para determinar a volatilidade na determinação do preço da opção; existe um ponto pouco claro em que o intervalo de valores históricos para determinar a volatilidade é determinado.

All Articles