Examen des données de prolifération de COVID-19 en utilisant des différences de premier ordre. Et qu'est-il arrivé

Salut Habr. L'idée est venue avec l'idée d'analyser les données en utilisant les différences. La méthode n'est pas nouvelle, mais l'essence de l'idée est d'étudier non pas les valeurs absolues des données de distribution, mais la part de l'agent (pays) dans l'ensemble total des agents (tous les pays). Et le comportement de cette part dans le processus de l'épidémie.

Dans la figure 1, il a présenté tous les points étudiés (près de 24 000, données du Centre européen de prévention et de contrôle des maladies ), c'est donc un peu boueux et a mis en évidence des lignes d'approximation pour les pays qui montrent clairement leur caractère avec des équations de régression et le coefficient R ^ 2 .


Figure. 1.

UFO Care Minute


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, .

, , .

: |

Dans les chiffres, sous le spoiler, il a présenté des données sur des pays sélectionnés en deux versions, lorsque la variation de la part de l'agent et les données réelles sur la croissance des personnes infectées sont examinées. Avec une petite analyse graphique. En général, on peut dire que la méthode de la différence dans cette interprétation peut fonctionner comme un indicateur avancé auxiliaire des processus de développement de la pandémie, quelque chose comme des indicateurs dans l'analyse technique des taux de change.

Graphiques

. 2.


. 3.


. 4.


. 5.


. 6.

Base théorique


Je présenterai les informations initiales sur le mécanisme de l'indicateur au début avec un exemple simple d'un exemple réel.

Prenez un groupe local de trois pays (Russie, Iran, États-Unis) pour la période du 22 avril 23 (figure 7).

1a) En Iran, le nombre de personnes infectées au 22/04/2020 était de 84 802.
1b) En Iran, le nombre de personnes infectées au 23 avril 2020 était de 85 996.
2a) En Russie, au 22 avril 2020, le nombre de personnes infectées s'élevait à 52 763 personnes.
2b) En Russie, le nombre de personnes infectées au 23 avril 2020 était de 57 999.
3a) Aux États-Unis, le nombre de personnes infectées au 22 avril 2020 était de 825041 personnes.
3b) Aux États-Unis, le nombre de personnes infectées au 23/04/2020 était de 842629 personnes.
4a) Le nombre total de personnes infectées, dans un ensemble de trois pays, au 22/04/2020 - 962606 personnes.
4b) Le nombre total de personnes infectées, dans un ensemble de trois pays, au 23/04/2020 - 986624 personnes.


Figure. 7. Justification

mathématique.

Indique le nombre total de personnes infectées à l'étape (en date) i - Ni.
Indique le nombre total de personnes infectées dans le pays j à la date i = Mji.
Ensuite, la fonction à l'étude a la forme:
Fji = Mji / Ni L'
incrément de la fonction dFji a la forme:



Cette fonction a une propriété d'équilibre importante, qui est que la somme de toutes les différences à chaque étape (à chaque date) est 0. En outre, la justification mathématique.



La deuxième conséquence de cette loi d'équilibre est que la somme de toutes les différences tout au long du processus de développement et de la vie de l'épidémie est également nulle. Le calcul est ci-dessous.



Ces différences ont trois états:

A) Moins de zéro;
B) vaut 0;
C) Plus de zéro.

Leur interprétation suit les règles standard pour l'étude des fonctions et, ici, je ne surchargerai pas ces aspects.

Considérons le comportement d'un graphe d'une fonction à l'infini. Nous rappelons que les principes modernes disent qu'aujourd'hui nous ne sommes pas en mesure d'éradiquer le virus, mais nous ne pouvons qu'essayer de ramener l'incidence pour cette raison à un niveau acceptable. Autrement dit, quelque part dans le futur, il y aura un état d'équilibre selon les conditions:
Mji + 1 = Mji + dj

Autrement dit, à la progression arithmétique, puis en supposant que la croissance (alpha) du nombre total de personnes infectées est supérieure à 1, nous obtenons:



Ceci est clairement visible dans le graphique pour la Chine.


Fig.12.

De ce qui précède, la propriété suivante est formée. Que ce modèle peut être stable en présence de sursauts locaux dans un ou une partie des agents (pays).

Nous raisonnons comme suit. Dans le processus de développement d'une pandémie, chaque pays finira par entrer dans la phase où les différences ultérieures approcheront zéro du côté négatif. Le nombre de ces pays augmentera et, idéalement, se rapprochera du nombre de k-1. Mais il ne peut plus y en avoir, car l'équation d'équilibre doit être respectée. À k-1, la somme totale des différences au i-ème pas sera inférieure à zéro. Et puis le k-ème pays devrait avoir une valeur de différence supérieure à zéro, de sorte que le solde final soit nul. C'est une montée subite. À l'étape i + 1, le k-ème pays réduit sa différence et il se déplace sur le graphique vers le demi-plan négatif. Mais cela n'est possible que s'il y a une poussée dans un ou plusieurs pays qui étaient auparavant dans la zone négative. C'est ce que nous voyons tous dans les flambées saisonnières de grippe,qui doit obéir aux mêmes lois.

En évaluant la complexité de la tâche, la première chose qui vient à l'esprit est le «problème des trois corps», mais il y en a 206. Il est théoriquement possible, mais pas clair, quel système d'équations différentielles devra être résolu. Mais d'un autre côté, le système d'équations différentielles implique des paramètres initiaux, et nous avons déjà beaucoup de tels paramètres. Étant donné que la plage de valeurs des fonctions est de -1 à +1 et que le système de diffours implique de nombreuses zones mortes. Selon le modèle construit, le montant du solde dû à des erreurs de calcul a divergé de zéro de 1 * 10 ^ -17. Autrement dit, la plage des valeurs étudiées est de 2 * 10 ^ 17. Je suppose que de telles conditions permettent de concevoir et d'entraîner un réseau neuronal, qui peut être plus rapide. Heureusement, le modèle est mis à l'échelle par ville pour chaque pays; par conséquent, les échantillons de formation peuvent être trouvés suffisamment.

Eh bien, une petite mouche dans ce modèle.

Lorsque j'ai examiné le solde des agents, j'ai constaté que les différences accumulées se comportent comme suit, comme dans la figure ci-dessous pour la Chine.


Fig.13.

La figure montre que la Chine prend toute la masse négative. La Chine exclue a reçu un calendrier similaire, mais la Thaïlande a repris la masse négative. Mon hypothèse sur cette propriété est la suivante. Jusqu'à présent, le nombre d'agents (pays) du modèle inchangé reflète les processus internes. Au stade où un nouvel agent est ajouté (c'est-à-dire qu'un infecté a été détecté dans un autre pays), le système capture le dernier état de l'étape précédente et cela devient les paramètres initiaux pour le suivant.

En résumé, on peut supposer que ce modèle peut être utilisé comme indicateur avancé de la propagation d'une pandémie et de processus similaires, tels que la distribution de certains produits, en particulier sur Internet. À un niveau intuitif, il a émis l'hypothèse que certains indicateurs de l'analyse technique pourraient être corrigés. J'examinerai également l'hypothèse de clarification de la méthode de détermination de la volatilité lors de la détermination du prix de l'option, il y a un point flou où l'intervalle des valeurs historiques pour déterminer la volatilité est déterminé.

All Articles