Supercomputer, Genomsequenzierung und die Aussichten, das Coronavirus zu besiegen

Justin Er, Global Communications Manager

Ein Tropfen Flüssigkeit, den eine Person ausatmet, kann Milliarden von Coronavirus-Partikeln enthalten. In jedem von ihnen werden mit bestimmten Variationen etwa 30.000 DNA-Nukleotide vorhanden sein. Dies ist ein Indikator für die Dichte im viralen Genom, die für jedes Merkmal und jede spezifische Eigenschaft des Virus verantwortlich ist - von seiner Virulenz bis zu den Übertragungsmechanismen. Forscher aus China und anderen Ländern der Welt haben bereits eine Reihe von Genomsequenzen des neuen SARS-CoV-2-Coronavirus identifiziert, die Wissenschaftlern und Ärzten Grundkenntnisse für den Kampf gegen Infektionen vermitteln.



UFO Care Minute


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, .

, , .

: |

Die Kartierung von Coronavirus-Genomen ist jedoch erst der Anfang der Arbeit. Exponentiell komplexer und ebenso wichtig für das Verständnis der Natur einer Pandemie ist die Bestimmung der Sequenz der Genome infizierter Menschen. Dies wirft viele Fragen auf: Warum ist ein Virus ansteckender als andere? Welche Mechanismen führen bei einigen Patienten zur Entstehung einer Lungenentzündung und bei anderen nur zu einem leichten Husten? Wie reagieren einzelne Patienten auf unterschiedliche Behandlungen oder Impfstoffe?

Antworten müssen im Bereich der Interaktion zwischen dem menschlichen Genom und Virusstämmen gesucht werden. Das Verständnis dieses Prozesses auf DNA-Ebene eröffnet den Weg zur Diagnose von Krankheiten, zur Entwicklung antiviraler Impfstoffe und zur Immuntherapie.



Forscher am BGI Genomics, die die ersten diagnostischen Testkits zum Nachweis der COVID-19-Krankheit entwickelt haben, sind an sorgfältigen und umfangreichen Arbeiten zur Entschlüsselung des Genoms des neuen Coronavirus beteiligt. Um einen wirksamen Impfstoff zu entwickeln, benötigen Wissenschaftler umfangreiche Datensätze, um genetische Unterschiede zu identifizieren und potenziellen Schutz zu schaffen. Bei einem derart umfangreichen Betrieb werden Terabyte und Petabyte an Daten generiert, deren Verarbeitung und Analyse nur HPC- Systeme ( High Performance Computing ) verarbeiten können .

Die Geschwindigkeit der Genomsequenzierung wächst mit der Zunahme der Rechenleistung. Ein Prozess, der ursprünglich über zehn Jahre dauerteund Milliarden kosten, jetzt können Sie in nur wenigen Stunden auf Clustern von Supercomputern laufen, die auf einer optimierten Hardwarearchitektur laufen. Die Forscher betonen, dass der Weg zur Herstellung eines Impfstoffs wahrscheinlich lang ist , aber solch ein beispielloser Satz von Werkzeugen wird dazu beitragen, die Zeit zu verkürzen.


"Um die Komplikationen einer Virusinfektion zu analysieren und zu identifizieren, sequenzierte BGI Genomics Hunderte klinischer Proben", sagte Xiangqin Jin, CTO von BGI Genomics. "Der Zugang zu den neuesten Technologien im Bereich Hochleistungsrechnen und Genomanalyse ist ein wichtiger Faktor für die Verbesserung der Analyseeffizienz."


BGI Genomics Researcher arbeitet mit T7 Sequencer zusammen

Intel und Lenovo haben sich zusammengeschlossen, um BGI zu unterstützen und die Fähigkeiten von COVID-19-Forschern zu erweitern. Sie präsentierten Wissenschaftlern einen Supercomputer-Cluster und boten ihr Fachwissen auf dem Gebiet von Software und Hardware für den effizientesten Einsatz an.
„Wir versuchen unser Bestes, um Wissenschaftler und Ärzte zu unterstützen, die im Kampf gegen das neue Coronavirus an vorderster Front stehen“, erklärt Milidi Giraldo, Lenovos führende Spezialistin für Genomforschung und -entwicklung.


Die für BGI bereitgestellte Technologie von Intel und Lenovo umfasst einen HPC-Cluster zur Verarbeitung von Hochleistungs-Lesevorgängen vom BGI DNBSEQ-T7-Sequenzer.

Dr. Giraldo hat mehrere Jahre an den National Institutes of Health (NIH) an der Bioinformatik-Forschung gearbeitet und zur Entwicklung von Impfstoffen zur Bekämpfung von Infektionskrankheiten beigetragen. Jetzt hilft es, die Interaktion zwischen Wissenschaftlern und Ingenieuren zu fördern, die Hardware und Software für die naturwissenschaftliche Industrie entwickeln.
"Wir spenden Ausrüstung und bieten unser Fachwissen an, aber die BGI-Forscher und andere Vertreter der biomedizinischen Gemeinschaft werden einen echten Durchbruch erzielen."

Der HPC-Cluster untersucht die Virulenz, die Übertragungsmuster von Krankheitserregern und die Wechselwirkungen zwischen Wirt und Virus. Als Ergebnis dieser Arbeit hofft BGI, seine COVID-19-Diagnosekits zu optimieren, viel Wissen über Coronaviren zu erlangen, die Entwicklung eines wirksamen Impfstoffs oder anderer Schutzmaßnahmen - beispielsweise der Immuntherapie - zu beschleunigen.

Genomdecodierung


Das Genom eines jeden Menschen auf der Erde kann als ein Buch mit tausend Seiten betrachtet werden. Ihr ungewöhnlicher Text wird jedoch nur vier Buchstaben enthalten: AGCT. Sie bezeichnen eine Kombination von Nukleotiden in der DNA und enthalten Anweisungen für jedes Merkmal, jedes Merkmal, das Sie zu dem macht, was Sie sind: Sie bestimmen Ihre Haarfarbe, Körpergröße und sogar die Anfälligkeit für eine Krankheit wie COVID-19. Die meisten dieser Anweisungen sind für alle Menschen gleich geschrieben, aber die wichtigsten Variationen sind nur auf wenigen Seiten versteckt.



Um zu verstehen, wie anfällig eine Person für Infektionen ist, müssen Forscher die genauen „Seiten“ (dh Gene) mit entsprechenden Anweisungen identifizieren. Dies kann nur durch einen Vergleich der „Seiten“ der maximal möglichen Anzahl von Patienten erreicht werden - mit der Identifizierung allgemeiner Merkmale und der anschließenden Verwendung von Daten, die diese Variationen mit der Reaktion auf eine Infektion verknüpfen.

Bei der Sequenzierung eines Genoms muss berücksichtigt werden, dass 1 ml einer biologischen Probe normalerweise Millionen verschiedener Virionen enthält und jedes von ihnen wiederum ein Genom mit ungefähr 30.000 DNA-Nukleotiden aufweist.

Diese äußerst schwierige Aufgabe, das Genom zu entschlüsseln und zu interpretieren, steht im Mittelpunkt des Kampfes der Wissenschaftler mit dem neuen Coronavirus. Das Verständnis der Wechselwirkung zwischen den entsprechenden menschlichen Genen und SARS-CoV-2 kann Wege aufzeigen, um Infektionen einzudämmen oder vollständig zu stoppen. Wissenschaftler werden auch im Buch des Coronavirus selbst nach gemeinsamen „Seiten“ suchen, um Bereiche des Genoms zu identifizieren, in denen der Erreger keine Mutationen übertragen kann. Dies ist eine Art Achillesferse, die den Weg zur Herstellung eines Impfstoffs oder zur Suche nach einer Behandlung ebnen kann.

Impfstoffentwicklung


In Filmen über Epidemien gibt es in der Regel einen Moment, in dem Wissenschaftler nach der einzigen Person suchen, die gegen die Krankheit immun ist. Dies ist sinnvoll: Die natürliche Immunität kann einen wichtigen Einblick in die Entwicklung eines wirksamen Impfstoffs geben.

«, , — . — , , . , , . , , — ».



Das Coronavirus krönt einen Ring aus kronenartigen Dornen, der seinen Namen bestimmt.

Betrachten Sie zwei Reaktionen des Patienten auf das Virus: Eine entwickelt eine lebensbedrohliche Lungenentzündung und die andere hat nur einen leichten Husten. Was erklärt diese Unterschiede? Reduzierte Immunität? Genetische Veranlagung? Folgen einer anderen vergangenen Krankheit? Alter? Fußboden? Ernährung? Die Dominanz eines bestimmten Virusstamms? Der Vergleich zweier Patienten ist nicht einfach, um diese Fragen zu beantworten. Und im Verhältnis zu Tausenden von Menschen nimmt die Komplexität der Aufgabe um ein Vielfaches zu.

Nur eine Vielzahl von Daten wird jedoch dazu beitragen, unzählige Variationen von Genen und Umweltfaktoren zu untersuchen. Je mehr klinische und genomische Daten Wissenschaftler haben, desto besser und genauer können sie gemeinsame Merkmale bei verschiedenen Patienten identifizieren.
Genomik auf Bevölkerungsskala besteht aus Milliarden von Informationen. Um das neue Coronavirus zu untersuchen, hoffen die Wissenschaftler, die DNA von Zehntausenden diagnostizierten Patienten vergleichen zu können. Dies ist eine komplexe Aufgabe, die viel Rechenleistung und hohe Kapazität erfordert und nur in HPC-Umgebungen verfügbar ist.

HPC-Optimierung


Erinnern Sie sich an das "Buch" des Genoms? Derjenige, dessen erste Lesung ein ganzes Jahrzehnt gedauert hat? Die Forscher analysieren nun das Genom in etwa 150 Stunden. Dies ist natürlich ein fantastischer Sprung, aber dennoch reicht eine solche Geschwindigkeit nicht aus, um die COVID-19-Pandemie zu bewältigen. Selbst die Auswahl und Sequenzierung von Bits, die die Struktur des Proteins und den Mechanismus der Vermehrung des Virus codieren (und dies sind mehrere "Seiten", die als Exome bezeichnet werden), dauert normalerweise mindestens 4 Stunden.

BGI-Forscher können jetzt auf HPC-Cluster zugreifen, die für das Sammeln und Analysieren von Hunderten von Genomen und Tausenden von Exomen optimiert sind.
« , BGI , , — - . — : , , ».

Basierend auf der leistungsstarken Lösung von Intel hat Lenovo eine optimierte Hardware- und Systemarchitektur entwickelt, mit deren Hilfe die Zeit zum Entschlüsseln eines Genoms drastisch reduziert werden kann. Das Genom Genomoptimierungs- und Skalierbarkeitstool (GOAST) von Lenovo nutzt die Open-Source- Software Genome Analysis Toolkit und optimierte Hardwareplattformen. Für die Auswahl der richtigen Hardware- und Softwarekomponenten zur Beschleunigung der Genomforschung mussten Hunderte von HPC-Konfigurationen getestet werden.
« , — - . — , . , « », . , , ».

Infolgedessen wird das gesamte menschliche Genom in fünfeinhalb Stunden sequenziert und in nur vier Minuten exom. Die Beschleunigung erreicht das 40-fache. Unterstützt von einem speziellen Supercomputer-Cluster werden BGI-Forscher bald mit GOAST aktiv daran arbeiten, das neue Coronavirus zu untersuchen und einen Impfstoff zu entwickeln.

Kurzfristig kann die Vorhersage der Virulenz anhand dominanter Stämme den Krankenhäusern helfen, Patienten effizienter zuzuordnen. Sie wissen, wer einem höheren Risiko ausgesetzt ist und welche Behandlungen am effektivsten sind. Auf lange Sicht wird neben der Entwicklung eines Impfstoffs die Kenntnis der Genomgeschichte und des Ursprungs des Virus dazu beitragen, zukünftige Ausbrüche zu verhindern. Im Allgemeinen ist dies ein unglaublich umfangreiches und komplexes Rätsel, das gelöst werden muss.

Moderne Geräte und Technologien werden die Erkennung von mit COVID-19 infizierten Personen beschleunigen, und die Untersuchung der Merkmale des Virusgenoms wird zu einer genauen Diagnose, erfolgreichen Behandlung und Prävention von Epidemien beitragen.

All Articles