超级计算机,基因组测序和击败冠状病毒的前景

全球传播经理Justin Er

人呼出的一滴液体可能含有数十亿个冠状病毒颗粒。在它们每个中,都有某些变异,将有大约30,000个核苷酸的DNA。这是病毒基因组密度的指标,它负责病毒的每个特征和特定特征-从其毒力到传播机制。来自中国和世界其他国家的研究人员已经确定了新型SARS-CoV-2冠状病毒的许多基因组序列,为科学家和医生提供了抗击感染的基础知识。



不明飞行物护理分钟


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, .

, , .

: |

但是绘制冠状病毒基因组图只是工作的开始。对于了解大流行的性质而言,指数上更为复杂且同等重要的是确定感染人群的基因组序列。这引起了很多问题:为什么一种病毒比其他病毒更具传染性?什么机制导致某些患者发生肺炎,而其他患者仅引起轻度咳嗽?个别患者对不同的治疗方法或疫苗会有怎样的反应?

在人类基因组和病毒株之间的相互作用领域必须寻求答案。从DNA层面了解这一过程为疾病诊断,抗病毒疫苗和免疫疗法的开发开辟了道路。BGI Genomics的



研究人员,他开发了第一批用于检测COVID-19疾病的诊断测试试剂盒,他参与了艰苦的大规模工作,以破译新的冠状病毒的基因组。为了开发有效的疫苗,科学家需要大量的数据集来识别遗传差异并提供潜在的保护。通过如此大规模的操作,将生成TB级和PB级的数据,只有高性能计算(HPC)系统才能处理和分析这些数据

基因组测序的速度随着计算能力的增长而增长。最初耗时十年的过程而且耗资数十亿美元,现在您只需几个小时即可在运行于优化硬件架构上的超级计算机集群上运行。研究人员强调,创建疫苗的道路可能很长,但是这种前所未有的工具集将有助于减少时间。


“为了分析和识别病毒感染的并发症,BGI Genomics对数百种临床样品进行了测序,” BGI Genomics首席技术官Jin Xiangqin Jin说。“获得高性能计算和基因组分析的最新技术是提高分析效率的重要因素。”


BGI基因组学研究人员与T7 Sequencer配合使用

为了支持BGI并扩大COVID-19研究人员的能力,英特尔和联想携手合作。他们为科学家们提供了一个超级计算机集群,并提供了他们在软件和硬件领域最有效使用的专业知识。
联想领先的基因组研发专家Milidi Giraldo解释说:“我们正在竭尽全力为站在抗击新型冠状病毒的科学家和医生提供支持。”


英特尔和联想为BGI提供的技术包括一个HPC集群,用于处理来自BGI DNBSEQ-T7序列发生器的高性能读取操作。

Giraldo博士已经在美国国立卫生研究院(NIH)从事生物信息学研究,多年来致力于开发抗击传染病的疫苗。现在,它有助于促进为自然科学行业开发硬件和软件的科学家与工程师之间的互动。
“我们捐赠设备并提供我们的专业知识,但是BGI研究人员和生物医学界的其他代表将提供真正的突破。”

HPC集群将研究毒力,病原体传播方式以及宿主与病毒之间的相互作用。这项工作的结果是,BGI希望优化其COVID-19诊断试剂盒,获得有关冠状病毒的大量知识,加速开发有效疫苗或采取其他保护性措施,例如免疫疗法。

基因组解码


可以将地球上每个人的基因组视为一千本书的书。但是她不寻常的文本仅包含四个字母:AGCT。它们表示DNA中核苷酸的组合,并包含每个特征的说明,每个特征都使您成为您:确定头发的颜色,高度甚至对像COVID-19的疾病的敏感性。这些说明中的大多数对所有人来说都是相同的,但是最重要的变化仅在几页上隐藏了。



为了了解一个人如何容易感染,研究人员必须在适当的指导下识别确切的“页面”(即基因)。这只能通过将最大患者数的“页”与一般特征的识别以及随后将这些变异与感染反应相关联的数据进行比较来完成。

在对基因组进行测序时,必须考虑到1毫升的生物样品通常包含数百万个不同的病毒体,而每个病毒体又具有一个具有约30,000个DNA核苷酸的基因组。

解码和解释基因组这一极其艰巨的任务,是科学家使用新型冠状病毒进行斗争的核心。了解相应的人类基因与SARS-CoV-2之间的相互作用可能会揭示遏制或完全阻止感染的方法。科学家还将在冠状病毒本身的书中寻找常见的“页面”,以识别病原体无法转移突变的基因组区域。这是一种致命弱点,可以为制造疫苗或寻求治疗开辟道路。

疫苗开发


通常,在有关流行病的电影中,有一段时间科学家会寻找唯一对这种疾病免疫的人。这是有道理的:自然免疫力可以为开发有效疫苗的方法提供关键见解。

«, , — . — , , . , , . , , — ».



冠状病毒冠状冠状刺刺的环,确定了它的名字。

考虑两种对这种病毒的患者反应:一种会威胁生命的肺炎,另一种只会轻度咳嗽。是什么解释了这些差异?免疫力降低?遗传易感性?另一个过去的疾病的后果?年龄?地板?营养?特定病毒株的优势?比较两个病人不容易回答这些问题。对于成千上万的人来说,任务的复杂性增加了很多倍。

然而,只有大量的数据将有助于开始研究基因和环境因素的无数变异的过程。科学家拥有的临床和基因组数据越多,他们就能更好,更准确地识别不同患者的共同特征。
人口规模的基因组学是数十亿条信息。为了研究新的冠状病毒,科学家希望比较数以万计确诊患者的DNA。这是一项复杂的任务,需要强大的处理能力和高容量,仅在HPC环境中可用。

HPC优化


还记得基因组的“书”吗?谁读了整整十年的书?研究人员现在可以在大约150小时内分析基因组。当然,这是一个了不起的飞跃,但是,这样的速度仍然不足以应对COVID-19大流行。甚至对编码蛋白质结构和病毒传播机制的位的选择和测序(这些都是称为外显子组的几个“页面”)通常也至少需要4个小时。

BGI研究人员现在可以访问为收集和分析多达数百个基因组和数千个外显子组而优化的HPC集群
« , BGI , , — - . — : , , ».

联想基于英特尔强大的解决方案,开发了优化的硬件和系统架构,可以帮助大大减少解密基因组的时间。联想的基因组基因组研究基因组优化和可扩展性工具(GOAST)利用开源的Genome Analysis Toolkit软件和优化的硬件平台。要选择合适的硬件和软件组件来加速基因组研究,就需要对数百种HPC配置进行测试。
« , — - . — , . , « », . , , ».

结果,整个人类基因组在五个半小时内完成了测序,而出世仅需四分钟。加速度达到40倍。在专用的超级计算机集群的支持下,BGI研究人员将很快开始使用GOAST进行积极的研究,以研究新的冠状病毒并生产疫苗。

在短期内,基于优势菌株预测毒力可以帮助医院更有效地分配患者-他们将知道谁的风险更大,哪种治疗最有效。从长远来看,除了制造疫苗之外,了解病毒的基因组历史和起源将有助于防止未来爆发。通常,这是一个需要解决的巨大而复杂的难题。

现代设备和技术将加快对感染COVID-19的人们的认识,对病毒基因组特征的研究将有助于准确诊断,成功治疗和预防流行病。

All Articles