为什么建立一个良好的COVID-19发行模型如此困难?



在这里,在大流行期间,我们像水族馆鱼一样从窗户向外望去。每个人都在想一件事:结局有多严重?然后立刻想到:认真的说,在这样狭窄的空间里我应该住多长时间?

我们都需要答案。考虑到有关新型冠状病毒的大量研究和数据收集,看来答案似乎必须出现。

确实有答案。问题是他们有眼泪。例如,美国疾病控制与预防中心使用的模型根据预测,在最好的情况下,有200,000美国人死于该病毒。与此同时,伦敦帝国理工学院一份报告成为头条新闻 在这种可怕的情况下,如果没有人改变自己的日常行为,将有220万人丧生。

不明飞行物护理分钟


大流行的COVID-19是由SARS-CoV-2冠状病毒(2019-nCoV)引起的潜在严重的急性呼吸道感染,已在全球正式宣布。关于Habré的很多信息都涉及此主题-始终记住,它既可靠又有用,反之亦然。

我们敦促您不要批评任何已发布的信息。


官方资料

, .

洗手,照顾亲人,尽可能呆在家里并远程工作。

阅读有关以下内容的出版物:冠状病毒 | 远程工作

这是,说得客气一点,一个他妈的向上散射-大致相同的人的数量之间的死亡每年从伤害和暴力的人数奄奄一息的时候,中国共产党抑制从1950年的反革命起义到1953年[作者,显然得到了朝鲜战争中国内战 /约。翻译]。换句话说,日常生活和事件之间的差异将永远改变它。

那么,这个巨大的差距是从哪里来的呢?亲爱的,这就是对这只野兽建模的本质。即使可能的结果之间存在差距,使用数学模型来预测未来也是专家的有用工具。但是,了解结果及其结果并不总是那么容易随着时间的推移变化,这种混乱会损害您的思想和感觉。因此,我们需要讨论大流行模型中包含的内容。也许了解不确定性将有助于您理清所有这些数字。

想象一个简单的数学模型来预测冠状病毒传播的结果。构建起来非常简单-这是我们的员工在电话会议中所做的事情。死于该病毒的人数是受感染人数,其传播速度以及该病毒可以杀死的人数百分比的函数。 也就是说,换句话说:





N() = N( ) * _ * _

很简单直到您尝试填写丢失的数据。事实证明,没有地方可以放置一个特定的数字。每个值取决于不同的选择和知识的缺乏。而且,如果模型的每个元素都发生波动,那么整个模型将面临相同的问题,以便保持稳定状态,就像记者在自我隔离期间经过长时间的电话会议后写数据一样。

考虑诸如数据输入之类的基本内容。不同的国家和地区以多种方式收集数据。没有一个电子表格可以一次填满,这使我们可以轻松比较世界上疾病和死亡的数量。甚至在美国,医生 COVID-19造成的死亡人数也被低估了。

同样的不一致也适用于病毒测试。一些国家对每个想要测试的人进行测试。其他情况下,没有这影响了我们对有多少人真正获得了COVID-19,以及有多少人找到它的知识。

此外,病毒本身的行为无法预测,对某些群体的伤害大于对其他群体的伤害-本地人口统计学和健康状况将很大程度上决定该病毒对社区的影响的结果。

俄亥俄州立大学流行病学教授比尔·米勒说:“我们,从事医疗保健的人们,有时工作时缺乏信息,试图根据非常不完整的信息做出最佳估计。”

死亡率




有些人死于COVID-19。而这很可能就是我们最后的无条件声明。但是,“ some”不是数字,您不能在其上构建数学。

问题在于,从一开始就计算出病毒死亡的百分比是不准确的。在不同的组中,它可能非常不同。加利福尼亚大学旧金山分校的生物统计学家雷·万尼尔(Ray Wannier)说:“年龄是一个非常重要的因素,因此我们必须考虑到美国的人口构成和慢性病的存在,重新计算死亡人数。”慢性疾病会加剧COVID-19的作用。

换句话说,没有单一的死亡率 -其中有很多。美国死亡率会有所不同来自一个糖尿病患者较少的国家的死亡率。在美国,系数也可以说是相同的-如果该病毒在老年人居住的郊区的城市中传播,那么计算出的死亡率将比分布中心在年轻人口大的城市要高。

但是,让我们转向国际统计。中国或意大利的COVID-19死亡率会否允许我们估算美国的死亡率?当然,此信息将是有用的-但它只会减少不确定性,并且不能完全确定。

当然,我们仍然不知道这些地区的确切死亡率。由于许多原因,从一组基本案例数据开始。数字不是事实。这是许多主观结论的结果,这些结论必须首先详细而透明地写成,然后才被视为事实。它会影响数据的收集方式以及收集数据的过程是否会不时变化。

还存在未收集或不正确的数据的问题。要确定死亡率,您需要将死于疾病的人数除以病例数。但是我们没有病人的确切数字-从数学上来说,我们不知道分母。坦率地说,我们也并不完全知道第一个数字,分子,但是,我们认为它接近现实。


« » COVID-19. - , , .

在理想的世界中,我们将检查所有人是否感染了新的冠状病毒,以确切了解有多少人,有多少人因此死亡。但是,仅在两种情况下我们就遇到了这种情况。以“钻石公主”(Diamond Princess)为例,其中一艘游轮在COVID-19爆发后被隔离。几乎所有乘客都通过了测试(为3711人进行了3063次测试)。 “钻石公主”已经成为一个活着的实验室,其数据收集条件通常在现实世界中不会加起来。研究人员不仅能够发现有多少人患病,而且还能发现有多少人没有症状-因此,有多少人将不会受到检查,不会被诊断,并且如果他们在陆地上也不会被考虑在内。

这个不寻常的实验的结果表明存在大量携带该病毒但不了解该病毒的人-因此,死亡率实际上低于根据数据得出的死亡率。在钻石公主的人口中,具有诊断和症状的人的死亡率为2.3%,但是,如果将所有诊断都考虑在内(即使没有症状的人),则系数为1.2%。 3月13日,在冰岛,deCODE Genetics开始为所有人,甚至没有症状的人提供免费测试。 3月29日,deCODE 在8694个测试中检测到 71名感染者,包括没有症状的人。

同时,症状比率(有症状的人数与没有症状的人数相比)也很重要,但与此同时,我们只能猜测一下。伦敦帝国理工学院一份报告表明,三分之二的症状足以使感染者感到并自我隔离。在“钻石公主”的数据中,发现在诊断时,有一半的人出现症状。实际症状比率会影响死亡率的计算。

但是,“钻石公主”的数据也不完美-他们并没有检查所有人,游轮上的乘客人口统计数据并不代表更广泛的人群,而且某些患者仍然可以死亡,这将增加死亡率。但是,在陆地上找不到更多现实的数据。来自冰岛的数据并未以相同的方法学细节发布。在美国,大规模测试才刚刚开始。如果像大多数州一样,仅对病人进行测试,死亡率将无法反映病毒的实际行为-分母问题再次抬头。此外,在美国进行检测还面临其他问题-缺乏检测以及某些私人实验室未发布阴性结果的事实。

真正的死亡率还受到我们防止病人死亡的能力的影响。这取决于医院的能力。由于可以无限制地使用重症监护病床和机械通风,许多症状严重的人都可以在感染中幸存。但是在美国,资源不足,如果需求超过供应(如该国某些地区已经发生的情况),那么在使用呼吸机时能够生存的人将会死亡。这可能导致多米诺骨牌效应。需要与该病毒无关的紧急护理的人也将遭受医院资源不足的困扰,甚至与COVID-19无关的死亡也将增加总体死亡率统计数字,尽管可以避免,尽管不应将其包括在内COVID-19的统计数据。

瓦格尼尔说:“我们是否会陷入物资和人员短缺,这将极大地影响道德,而且尚不清楚我们的医疗保健系统将有多灵活。”

而且还有感染率




我们谈论的死亡率几乎所有内容都适用于感染率:所有估计值都取决于数据收集,抽样和症状发生率。但是要了解感染率,您仍然需要了解病毒从一个人传播到另一个人的频率。您可能听说过基本生殖数(缩写为R 0这样的术语-这是一个感染个体在完全对这种疾病敏感的个体组成的人群中发生的平均继发感染数。

事实是:病毒的传播肯定会发生巨大波动,并取决于社会行为的各种特征,当地环境的详细信息和政治决定。在不同的国家,所有这些都会有所不同。甚至在美国的不同州。同样,这些参数会随着时间的流逝而变化,这取决于我们为对抗病毒所采取的措施。例如,疟疾中积水很多的地方R 0更大。

因此,对COVID-19的潜在分布结果进行建模必须包括许多不同的病毒传播方案。而且它们不是精确的。这将是一定范围的收视率。在这些情况下,需要考虑几个估计,每个估计也可以更改(严重的是,这只是无穷无尽的回归)。

第一个变量是接触系数-实际上,在一定时间段内被感染者与多少人互动。只有此参数受人约束,这就是为什么每个人都被锁定并谈论社交距离的原因。平均接触系数是不同的-每个人的接触系数各不相同,具体取决于诸如栖息地和工作情况等因素,还取决于医疗保健系统的反应方式以及一切发生的地点。米勒说:“想象一下农村州的高地和大城市的商业区之间的区别。”

然后是齿轮比。这是一种通过遇见感染者来想象感染人数的方法。这也是一个移动的目标。病毒没有按照统一的模式传播,例如“每人两个新病例”。该过程以不规则的跳跃进行,就像一群郊区居民用厕纸扑在架子上一样。东北大学教授传染病模型的山姆·斯卡皮诺(Sam Scarpino)称这种情况为“过度扩散事件”,这种情况下,通常更多地取决于行动地点而不是人们的因素使病例数量骤然上升。回想一下曾经负责的Biogen会议在马萨诸塞州诊断出的95例病例中有77例。或是一个女人单枪匹马地打破了韩国有效遏制策略。

还记得症状比率吗?一些人认为带有症状的携带者比没有症状的携带者感染的人少,因此该比率也会影响传播率。在重新计算与联系人的转移次数时,

病毒学也很重要。在这里,您需要考虑病毒在表面上可以存活多长时间(以及它在什么表面上存活)以及可以在空中飞多远。随着新COVID-19,也有不同等级两个因素。。身体和人类行为之间仍然存在差异。例如,吸烟者可能更有感染和并发症的危险。尽管这主要是由于吸烟对肺部的影响以及病毒在体内的作用,但它也影响了吸烟者经常把手伸向嘴巴的事实,从而增加了传播的风险。

最后,还有传染的持续时间-一个人可以传播病毒多长时间,并且在该疾病的哪个时期具有传染性?俄亥俄州立大学环境,流行病学和健康计划主任马克·威尔说,这取决于病毒的生物学和个体免疫系统。

所有这些参数都用于估计R 0,基本生殖数。

而且,如果基本生殖数意味着整个人口的脆弱性,那么仍然存在一个有效的生殖数,这取决于人口中易感染该病毒的百分比。人群对新的冠状病毒高度脆弱的原因之一是,该病毒确实是新病毒。以前没有人。

同样,一个好的模型需要考虑再感染这样的问题:如果接收该病毒并从中恢复的人获得了对它的免疫力,那么脆弱人群的百分比就会降低。但是到目前为止,我们感染后的免疫力了解不多

而且,我们甚至都没有提到打开疫苗时脆弱性的这种变化。但是我们已经有了足够的细节。

混合成模型


要创建模型,您需要收集所有这些变量(以及编辑器不允许我们谈论的其他变量),并考虑其不确定性,联合相关性以及许多其他因素。事实证明这可能是一件相当复杂的事情。

所有这些因素都可能受到干扰病毒传播的所有尝试的影响,例如社交距离,洗手,关闭学校,减少非紧急手术的次数等。这是一个巨大的未知数,能够从根本上改变疫情的形式-而且还取决于国家,州甚至城市。



就像烤馅饼。使用正常的配方,可以非常简单地完成它,并期望得到有意义且可预测的结果。但是,如果食谱中包含诸如“根据您手头上的食物,添加3至15个苹果,牛排或布鲁塞尔芽菜片”之类的说明,那肯定会影响派的味道,对吗?您可以对成分及其数量的正确性做出假设。但这仅仅是假设,不是确切的事实。而且,如果您在烹饪时做出太多的假设,那么您可能做不到您想做的事情。而且您不一定知道自己弄错了。

在接下来的几个月中,您将对COVID-19大流行的结果遇到许多不同的预测。并非所有人都一样。但是,仅仅因为它们基于假设并不意味着它们是无用的。

威尔说:“所有模型都是错误的,我们只是努力使它们今天变得不真实和不实用。”

我们想吃饭,所以必须有人做饭。一定要问这个蛋糕是由什么成分和多少制成的。

All Articles