COVID-19:预测冠状病毒患者的数量

冠状病毒最终占领了整个世界-但事实并非如此,因为地球上的每个居民都设法获得了它。目前,无论是在世界新闻还是在俄罗斯新闻中,这一主题都是主要且唯一的主题。在本文中,我们将尝试从有关中国军方是否发动该病毒或唐纳德·特朗普的政治和争论中尽可能地抽象出来。取而代之的是,我们从数学角度看问题-即,我们将找到如何用一个方程式描述流行病的方法,并且在本文结尾处,我们将预测被感染的COVID-19的总数-包括在俄罗斯。



不明飞行物护理分钟


大流行的COVID-19是由SARS-CoV-2冠状病毒(2019-nCoV)引起的潜在严重的急性呼吸道感染,已在全球正式宣布。关于Habré的很多信息都涉及此主题-始终记住,它既可靠又有用,反之亦然。

我们敦促您不要批评任何已发布的信息。


官方资料

, .

洗手,照顾亲人,尽可能呆在家里并远程工作。

阅读有关以下内容的出版物:冠状病毒 | 远程工作

理论:流行方程


甚至不到一个世纪前的1927年,两位科学家Kermak和McKendrick在他们的文章中向世界提出了可以用数学方法描述流行病传播的思想。在最简单的情况下,当N个人群被某种病毒感染时,在人群本身中要么健康(S)要么生病而无法恢复(I),则在时间t的感染人口比例方程如下所示:

i(t)=i0i0+(1i0)eβt,


哪里 i0代表总感染人数的初始比例,并且 β正是由于这种参数,我们才可以调节病毒在人与人之间传播的可能性,并可以在整个人群被感染的那一刻放大/缩小(因为t,i(t)1

似乎很鉴赏家,这些家伙是从比利时数学家Verhulst 借来的逻辑曲线方程式-但是,在这种情况下,这个方程式只是解微分方程组的结果(我不会进入数学丛林,但是如果有人感兴趣,这可以解释一切流行理论,这里 -一如既往,格兰特·桑德森的出色可视化)。

函数图类似于拉长的拉丁字母s(这可能就是为什么有时也将其称为s曲线)的原因:



现在,在直接进行建模之前,有一个小小的破坏者可以将此模型反映在现实中,尤其是在COVID-19的情况下:查看约翰内斯·霍普金斯大学(Johns Hopkins University)的一个项目中检测到的中国大陆感染病例表



我们导出COVID-19的方程式


上面提出的模型需要满足大量先决条件,例如恒定的人口,彼此接触的可能性等。另外,在包含已恢复/死亡的人群中引入了另一个组(R)(即,他们不再能够被病毒感染),该模型仍然与感染的初始数量密切相关。

实际上,仅基于一个初始条件来推导模型是没有意义的,因为 在每个国家(甚至地区),其自身病毒传播的特征-在两个地区,受感染的总数可能有很大不同,i0=1单一比例β 帮助 i0事实也证明这是不够的-太多因素影响病毒的传播并以自己的方式弯曲/破坏逻辑曲线。

在这方面,我们建议通过最大化其参数化来修改已确认病毒感染病例数的方程式:

i(t)=ab+cedβt,


在这种情况下,我们还以指数形式引入了该术语-使用5个参数代替2个参数,我们当然可以微调曲线。

参数选择


由于以下事实,我们拥有第一个检测到的感染病例的数据 n大流行的日子,而不仅仅是刚开始的时候,即 确诊病例的一组值(y0,y1,,yn),我们可以减少寻找最佳参数的问题 (a,b,c,d,β)关于最小化偏差平方和的问题:

t=1n(yti(t))2min


尽可能简化任务,我们为每个功能参数确定了最终的一组值 i(t),实际上,我们通过在网格中搜索上述损失函数来优化超参数。

国家预测


我想强调的是,预测的确诊病例数是病毒的预测数,而不是死亡和恢复的病例数,因为感染后疾病的进程非常个别地进行,如果基于一般的统计数据,则任何预后都将非常不准确。

预测数据来自约翰霍普金斯大学GitHub项目。确诊病例的预测值以该国人口的一部分乘以10,000给出(必须进行相乘,以便结果的数字不会很小,否则该算法将仅预测零)。沿轴x从第一例病毒感染的登记开始,有几天的时间。

这些图显示了当前已确认的案例(实际当前已确认),同一日期但由模型预测的值(已确定的当前预测)和接下来30天的预测值(已确定的未来)。

中国


该病毒是在湖北省省会武汉市首次发现的。事实证明,第一起案件并未像先前认为的那样在2019年12月底进行注册,但已经在11月17日进行了注册这并没有改变本质,而且由于中国政府在确保隔离方面采取的明确行动,到2月底,我们设法制止了当地的大流行。但是,我们立即保留了该模型的数据,仅从1月22日开始可用,到那时为止,已经注册了444个案例。


第一次感染的数据:01/22/2020

意大利


保罗·索伦蒂诺(Paolo Sorrentino)的故乡已成为欧洲传播这种病毒的温床-这不仅是由于意大利在中国游客中的受欢迎程度(真实),而且还由于意大利人对洗手的特殊爱好(笑话)。


第一次感染的数据:01/31/2020

德国


总理安格拉•默克尔(Angela Merkel)宣布了该国70%的人口最终将感染冠状病毒,引起了国际社会的注意


第一次感染数据:2020年1月27

日,但是,根据预测,将超过0.05%的感染率

西班牙


炙手可热的男子气概决定跟上他们的“气候同事”(当然是意大利人)-到目前为止,没有理由谈论即将传播的病毒的灭绝。
但是,西班牙人并不灰心,并提出了最令人着迷的冠状病毒假货-最近有消息传出,有119人妓院在巴伦西亚被隔离,其中86名是客户,原因是其中一名代表在最古老的行业中检测到冠状病毒-显然是咳嗽,并在来访者中找到了医生。


第一次感染的数据:02/01/2020

俄国


从是否已记录所有病例的角度来看,我国冠状病毒周围的情况仍然不清楚-否则如何解释没有其他研究便无法与冠状病毒区分开的肺炎病例急剧增加

但是更有趣的是该病毒如何在全国传播。在莫斯科运营中心创建的特殊页面上,维护了航班清单那个病人来了也就是说,该病毒大部分与在国外度假/工作的同胞一起进入该国。如果我们比较该国的平均月薪和飞往欧洲的机票价格,结果发现并非最贫穷的人带来了这种病毒。然后是时候转向图论,即分类概念,意味着在联系(交流)中存在偏好的社交网络(社会)的存在-换句话说,基本上是富人与富人交流,穷人与穷人交流。总的来说,事实证明,对于俄罗斯来说,冠状病毒是富人的疾病。因此,如果您(我亲爱的读者)当前正在喀山站附近的地铁地下通道中,并且现在您正在杀死一只用靴子奔跑的老鼠,那么您也许是我们国家中风险最高的组织的一部分。

但是,不要急于高兴-因为分类偏好理论有一个细微差别。想象一下,学校有两组女孩互相交流-漂亮又丑陋。但是,我们都记得最美丽的女孩有一个丑陋的女友-现在我们通过这种联系得到了两个群体的联系。

正是基于同样的原则,一个从意大利带毒返回的富有的女商人可能有一个退休的母亲,她定期去探望母亲,然后她又与院子里的其他养老金领取者进行交流-这就是病毒在两个人之间流动的方式。人口阶层。


第一次感染的数据:01/31/2020

根据该模型的预测,俄罗斯距离拐点仍很远,即 在那一刻之后,生病的人数与前一天相比将越来越少。

摘要


当然,提出的模型是非常基本的:

  • 它没有考虑到从冬季到春季温度背景的变化,因此病毒的传播活动应该在温度升高后下降
  • 忽视了关闭国界,在国家内部建立了更严格的检疫措施,结果降低了人与人之间的接触强度
  • : , ; grid search ; , EM- ..

但是,如果您对此主题感兴趣,我们建议您参加最热门的COVID-19开放研究数据集挑战赛(CORD-19),并解决问题:从确定风险因素到生产疫苗!

从今天起,我们还将在Telegram(@CoronavirusMonitorBot)中启动我们的机器人,在其中我们使用冠状病毒监控有关该情况的最新信息。我们建议您订阅以了解情况如何发展。

我要说的主要事情是,不必惊慌。在这种情况下,遵守基本卫生规则并避免拥挤的区域将有助于避免病毒传播的爆炸性性质。对于其余的,依靠数学:)

All Articles