Supercalculateurs, séquençage du génome et perspectives de vaincre le coronavirus

Justin Er, Global Communications Manager

Une goutte de liquide qu'une personne expire peut contenir des milliards de particules de coronavirus. Dans chacun d'eux, avec certaines variations, il y aura environ 30 000 nucléotides d'ADN. Tel est l'indicateur de densité dans le génome viral, qui est responsable de chaque caractéristique et trait spécifique du virus - de sa virulence aux mécanismes de transmission. Des chercheurs chinois et d'autres pays du monde ont déjà identifié un certain nombre de séquences génomiques du nouveau coronavirus SARS-CoV-2, fournissant aux scientifiques et aux médecins des connaissances de base pour commencer la lutte contre l'infection.



UFO Care Minute


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, .

, , .

: |

Mais cartographier les génomes des coronavirus n'est que le début des travaux. Exponentiellement plus complexe et tout aussi important pour comprendre la nature d'une pandémie est de déterminer la séquence des génomes des personnes infectées. Cela soulÚve de nombreuses questions: pourquoi un virus est-il plus contagieux que d'autres? Quels mécanismes conduisent au développement d'une pneumonie chez certains patients et seulement d'une légÚre toux chez d'autres? Comment les patients individuels réagiront-ils aux différents traitements ou vaccins?

Des rĂ©ponses doivent ĂȘtre recherchĂ©es dans le domaine de l'interaction entre le gĂ©nome humain et les souches virales. La comprĂ©hension de ce processus au niveau de l'ADN ouvre la voie au diagnostic des maladies, au dĂ©veloppement de vaccins antiviraux et Ă  l'immunothĂ©rapie.



Chercheurs à BGI Genomics, qui a développé les premiers kits de tests diagnostiques pour la détection de la maladie COVID-19, est impliqué dans des travaux minutieux et à grande échelle pour déchiffrer le génome du nouveau coronavirus. Pour développer un vaccin efficace, les scientifiques ont besoin d'ensembles de données massifs pour identifier les différences génétiques et créer une protection potentielle. Avec une telle opération à grande échelle, des téraoctets et des pétaoctets de données sont générés, avec le traitement et l'analyse dont seuls les systÚmes de calcul haute performance (HPC) peuvent gérer .

La vitesse de séquençage du génome augmente avec la croissance de la puissance de calcul. Un processus qui a pris à l' origine plus de dix anset coûtent des milliards, vous pouvez désormais exécuter en quelques heures seulement des grappes de superordinateurs fonctionnant sur une architecture matérielle optimisée. Les chercheurs soulignent que le chemin vers la création d'un vaccin sera probablement long , mais un tel ensemble d'outils sans précédent contribuera à réduire le temps.


"Pour analyser et identifier les complications d'une infection virale, BGI Genomics a séquencé des centaines d'échantillons cliniques", a déclaré Xiangqin Jin, directeur technique de BGI Genomics. «L'accÚs aux derniÚres technologies en matiÚre de calcul haute performance et d'analyse génomique est un facteur important pour améliorer l'efficacité de l'analyse.»


BGI Genomics Researcher travaille avec le séquenceur T7

Désireux de soutenir BGI et de permettre aux chercheurs de COVID-19, Intel et Lenovo ont uni leurs forces. Ils ont présenté aux scientifiques un cluster de superordinateurs et ont également offert leur expertise dans le domaine des logiciels et du matériel pour une utilisation la plus efficace.
«Nous faisons de notre mieux pour soutenir les scientifiques et les médecins qui sont à l'avant-garde de la lutte contre le nouveau coronavirus», explique Milidi Giraldo, leader de la recherche et du développement génomique de Lenovo.


La technologie fournie par Intel et Lenovo pour BGI comprend un cluster HPC pour gérer les opérations de lecture hautes performances à partir du séquenceur BGI DNBSEQ-T7.

Le Dr Giraldo a travaillé sur la recherche en bioinformatique aux National Institutes of Health (NIH) pendant plusieurs années, contribuant au développement de vaccins pour lutter contre les maladies infectieuses. Maintenant, il contribue à favoriser l'interaction entre les scientifiques et les ingénieurs qui développent du matériel et des logiciels pour l'industrie des sciences naturelles.
«Nous donnons de l'équipement et offrons notre expertise, mais les chercheurs du BGI et d'autres représentants de la communauté biomédicale fourniront une véritable percée.»

Le cluster HPC étudiera la virulence, les modes de transmission des agents pathogÚnes et les interactions entre l'hÎte et le virus. Grùce à ces travaux, BGI espÚre optimiser ses kits de diagnostic COVID-19, acquérir de nombreuses connaissances sur le coronavirus, accélérer le développement d'un vaccin efficace ou d'autres mesures de protection - par exemple, l'immunothérapie.

Décodage du génome


Le gĂ©nome de chaque personne sur Terre peut ĂȘtre considĂ©rĂ© comme un livre de mille pages. Mais son texte inhabituel ne contiendra que quatre lettres: AGCT. Ils dĂ©notent une combinaison de nuclĂ©otides dans l'ADN et contiennent des instructions pour chaque trait, chaque caractĂ©ristique qui fait de vous qui vous ĂȘtes: dĂ©termine la couleur de vos cheveux, leur taille et mĂȘme leur sensibilitĂ© Ă  une maladie comme COVID-19. La plupart de ces instructions sont Ă©crites de la mĂȘme maniĂšre pour toutes les personnes, mais les variations les plus importantes sont masquĂ©es sur quelques pages seulement.



Pour comprendre comment une personne est susceptible d'ĂȘtre infectĂ©e, les chercheurs doivent identifier les «pages» exactes (c'est-Ă -dire les gĂšnes) avec les instructions appropriĂ©es. Cela ne peut se faire qu'en comparant les «pages» du nombre maximum de patients possible - avec l'identification des caractĂ©ristiques gĂ©nĂ©rales et l'utilisation ultĂ©rieure de donnĂ©es reliant ces variations Ă  la rĂ©ponse Ă  l'infection.

Lors du séquençage d'un génome, il faut tenir compte du fait que 1 ml d'un échantillon biologique contient généralement des millions de virions différents, et chacun d'eux, à son tour, a un génome avec environ 30 000 nucléotides d'ADN.

Cette tĂąche extrĂȘmement difficile de dĂ©codage et d'interprĂ©tation du gĂ©nome est au cƓur de la lutte des scientifiques avec le nouveau coronavirus. Comprendre l'interaction entre les gĂšnes humains correspondants et le SRAS-CoV-2 peut rĂ©vĂ©ler des moyens de contenir ou d'arrĂȘter complĂštement l'infection. Les scientifiques chercheront Ă©galement des «pages» communes dans le livre du coronavirus lui-mĂȘme - pour identifier les zones du gĂ©nome dans lesquelles l'agent pathogĂšne ne peut pas transfĂ©rer de mutations. C'est une sorte de talon d'Achille, qui peut ouvrir la voie Ă  la crĂ©ation d'un vaccin ou Ă  la recherche d'un traitement.

DĂ©veloppement de vaccins


Dans les films sur les Ă©pidĂ©mies, en rĂšgle gĂ©nĂ©rale, il y a un moment oĂč les scientifiques recherchent la seule personne immunisĂ©e contre la maladie. Cela a un certain sens: l'immunitĂ© naturelle peut fournir un aperçu clĂ© des moyens de dĂ©velopper un vaccin efficace.

«, , — . — , , . , , . , , — ».



Le coronavirus couronne un anneau d'épines en forme de couronne, qui a déterminé son nom.

ConsidĂ©rez deux rĂ©ponses des patients au virus: l'une dĂ©veloppe une pneumonie potentiellement mortelle et l'autre n'a qu'une toux lĂ©gĂšre. Qu'est-ce qui explique ces diffĂ©rences? ImmunitĂ© rĂ©duite? PrĂ©disposition gĂ©nĂ©tique? ConsĂ©quences d'une autre maladie passĂ©e? Âge? Sol? Nutrition? La domination d'une souche spĂ©cifique du virus? Il n'est pas facile de comparer deux patients pour rĂ©pondre Ă  ces questions. Et par rapport Ă  des milliers de personnes, la complexitĂ© de la tĂąche augmente plusieurs fois.

Cependant, seule une vaste gamme de données aidera à démarrer le processus d'étude d'innombrables variations des gÚnes et des facteurs environnementaux. Plus les scientifiques disposeront de données cliniques et génomiques, mieux et plus précisément ils pourront identifier les caractéristiques communes à différents patients.
La génomique à l'échelle de la population représente des milliards d'informations. Pour étudier le nouveau coronavirus, les scientifiques espÚrent comparer l'ADN de dizaines de milliers de patients diagnostiqués. Il s'agit d'une tùche complexe nécessitant une puissance de traitement importante et une capacité élevée, disponible uniquement dans les environnements HPC.

Optimisation HPC


Rappelez-vous le «livre» du gĂ©nome? Celui dont la premiĂšre lecture a pris une dĂ©cennie entiĂšre? Les chercheurs analysent maintenant le gĂ©nome en environ 150 heures. C'est, bien sĂ»r, un bond fantastique, mais une telle vitesse n'est pas suffisante pour faire face Ă  la pandĂ©mie de COVID-19. MĂȘme la sĂ©lection et le sĂ©quençage de bits qui codent la structure de la protĂ©ine et le mĂ©canisme de propagation du virus (et ce sont plusieurs "pages" appelĂ©es exomes) prennent gĂ©nĂ©ralement au moins 4 heures.

Les chercheurs BGI peuvent désormais accéder à des clusters HPC optimisés pour collecter et analyser des centaines de génomes et des milliers d'exomes.
« , BGI , , — - . — : , , ».

Basé sur la puissante solution d'Intel, Lenovo a développé une architecture matérielle et systÚme optimisée qui peut aider à réduire considérablement le temps nécessaire pour décrypter un génome. L' outil d'optimisation et d'évolutivité Genomic Genomic Research Genomics de Lenovo (GOAST) s'appuie sur le logiciel open source Genome Analysis Toolkit et des plates-formes matérielles optimisées. Le choix des bons composants matériels et logiciels pour accélérer la recherche génomique a nécessité de tester des centaines de configurations HPC.
« , — - . — , . , « », . , , ».

En conséquence, le génome humain entier est séquencé en cinq heures et demie et exom en seulement quatre minutes. L'accélération atteint 40 fois. Soutenus par un cluster de superordinateurs dédié, les chercheurs de BGI commenceront bientÎt des travaux actifs en utilisant GOAST pour étudier le nouveau coronavirus et créer un vaccin.

À court terme, la prĂ©diction de la virulence basĂ©e sur les souches dominantes peut aider les hĂŽpitaux Ă  rĂ©partir les patients plus efficacement - ils sauront qui est le plus Ă  risque et quels traitements seront les plus efficaces. À long terme, en plus de crĂ©er un vaccin, la connaissance de l'histoire gĂ©nomique et de l'origine du virus aidera Ă  prĂ©venir de futures Ă©pidĂ©mies. En gĂ©nĂ©ral, il s'agit d'un puzzle incroyablement vaste et complexe qui doit ĂȘtre rĂ©solu.

L'équipement et les technologies modernes accéléreront la reconnaissance des personnes infectées par COVID-19, et l'étude des caractéristiques du génome du virus contribuera à un diagnostic précis, à un traitement efficace et à la prévention des épidémies.

All Articles