Supercomputadoras, secuenciación del genoma y las perspectivas de derrotar al coronavirus.

Justin Er, gerente de comunicaciones globales

Una gota de líquido que una persona exhala puede contener miles de millones de partículas de coronavirus. En cada uno de ellos, con ciertas variaciones, habrá aproximadamente 30,000 nucleótidos de ADN. Tal es el indicador de densidad en el genoma viral, que es responsable de cada rasgo característico y específico del virus, desde su virulencia hasta los mecanismos de transmisión. Investigadores de China y otros países ya han identificado una serie de secuencias genómicas para el nuevo coronavirus SARS-CoV-2, proporcionando a científicos y médicos conocimientos básicos para comenzar la lucha contra la infección.



Minuto de atención ovni


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, .

, , .

: |

Pero el mapeo de genomas de coronavirus es solo el comienzo del trabajo. Exponencialmente más complejo e igualmente importante para comprender la naturaleza de una pandemia es determinar la secuencia de los genomas de las personas infectadas. Esto plantea muchas preguntas: ¿por qué un virus es más contagioso que otros? ¿Qué mecanismos conducen al desarrollo de neumonía en algunos pacientes y solo una tos leve en otros? ¿Cómo responderán los pacientes individuales a diferentes tratamientos o vacunas?

Deben buscarse respuestas en el campo de interacción entre el genoma humano y las cepas de virus. Comprender este proceso a nivel de ADN abre el camino para el diagnóstico de enfermedades, el desarrollo de vacunas antivirales y la inmunoterapia.



Investigadores en BGI Genomics, quienes desarrollaron los primeros kits de pruebas de diagnóstico para la detección de la enfermedad COVID-19, están involucrados en un trabajo minucioso y a gran escala para descifrar el genoma del nuevo coronavirus. Para desarrollar una vacuna efectiva, los científicos necesitan conjuntos de datos masivos para identificar diferencias genéticas y crear una protección potencial. Con una operación tan a gran escala, se generan terabytes y petabytes de datos, cuyo procesamiento y análisis solo pueden manejar los sistemas de computación de alto rendimiento (HPC).

La velocidad de la secuenciación del genoma está creciendo junto con el crecimiento de la potencia informática. Un proceso que originalmente tomó más de diez años.y cuesta miles de millones, ahora puede ejecutarse en solo unas pocas horas en grupos de supercomputadoras que se ejecutan en una arquitectura de hardware optimizada. Los investigadores enfatizan que el camino para crear una vacuna probablemente sea ​​largo , pero un conjunto de herramientas sin precedentes ayudará a reducir el tiempo.


"Para analizar e identificar las complicaciones de una infección viral, BGI Genomics secuenciado cientos de muestras clínicas", dijo Xiangqin Jin, CTO, BGI Genomics. "El acceso a la última tecnología en informática de alto rendimiento y análisis genómico es un factor importante para mejorar la eficiencia del análisis".


El investigador de BGI Genomics trabaja con el secuenciador T7

Queriendo apoyar a BGI y capacitar a los investigadores de COVID-19, Intel y Lenovo han unido sus fuerzas. Presentaron a los científicos un grupo de supercomputadoras y también ofrecieron su experiencia en el campo del software y el hardware para el uso más eficiente.
"Estamos haciendo todo lo posible para apoyar a los científicos y médicos que están a la vanguardia de la lucha contra el nuevo coronavirus", explica Milidi Giraldo, la principal especialista en investigación y desarrollo genómico de Lenovo.


La tecnología que Intel y Lenovo proporcionaron para BGI incluye un clúster HPC para procesar operaciones de lectura de alto rendimiento del secuenciador BGI DNBSEQ-T7.

El Dr. Giraldo ha trabajado en investigación bioinformática en los Institutos Nacionales de Salud (NIH) durante varios años, contribuyendo al desarrollo de vacunas para combatir enfermedades infecciosas. Ahora ayuda a fomentar la interacción entre científicos e ingenieros que desarrollan hardware y software para la industria de las ciencias naturales.
"Donamos equipos y ofrecemos nuestra experiencia, pero los investigadores de BGI y otros representantes de la comunidad biomédica proporcionarán un verdadero avance".

El grupo de HPC estudiará la virulencia, los patrones de transmisión de patógenos y las interacciones entre el huésped y el virus. Como resultado de este trabajo, BGI espera optimizar sus kits de diagnóstico COVID-19, obtener mucho conocimiento sobre el coronavirus, acelerar el desarrollo de una vacuna eficaz u otras medidas de protección, por ejemplo, la inmunoterapia.

Decodificación del genoma


El genoma de cada persona en la Tierra puede considerarse como un libro con mil páginas. Pero su texto inusual contendrá solo cuatro letras: AGCT. Denotan una combinación de nucleótidos en el ADN y contienen instrucciones para cada rasgo, cada característica que te hace quien eres: determina el color de tu cabello, la altura e incluso la susceptibilidad a una enfermedad como COVID-19. La mayoría de estas instrucciones están escritas de la misma manera para todas las personas, pero las variaciones más importantes están ocultas en unas pocas páginas.



Para comprender cómo una persona es susceptible a la infección, los investigadores deben identificar las "páginas" exactas (es decir, los genes) con las instrucciones apropiadas. Esto solo se puede hacer comparando las "páginas" del número máximo posible de pacientes, con la identificación de características generales y el uso posterior de datos que vinculan estas variaciones con la respuesta a la infección.

Al secuenciar un genoma, se debe tener en cuenta que 1 ml de una muestra biológica generalmente contiene millones de viriones diferentes, y cada uno de ellos, a su vez, tiene un genoma con aproximadamente 30,000 nucleótidos de ADN.

Esta tarea extremadamente difícil de decodificar e interpretar el genoma se encuentra en el corazón de la lucha de los científicos con el nuevo coronavirus. Comprender la interacción entre los genes humanos correspondientes y el SARS-CoV-2 puede revelar formas de contener o detener completamente la infección. Los científicos también buscarán "páginas" comunes en el libro del coronavirus mismo, para identificar áreas del genoma en las que el patógeno no puede transferir mutaciones. Este es un tipo de talón de Aquiles, que puede abrir el camino para crear una vacuna o buscar tratamiento.

Desarrollo de vacunas.


En las películas sobre epidemias, por regla general, hay un momento en que los científicos buscan a la única persona inmune a la enfermedad. Esto tiene algún sentido: la inmunidad natural puede proporcionar una idea clave de las formas de desarrollar una vacuna eficaz.

«, , — . — , , . , , . , , — ».



El coronavirus corona un anillo de espinas en forma de corona, que determinó su nombre.

Considere dos respuestas de los pacientes al virus: una desarrolla una neumonía potencialmente mortal y la otra solo tiene una tos leve. ¿Qué explica estas diferencias? Inmunidad reducida? ¿Predisposición genética? ¿Consecuencias de otra enfermedad pasada? ¿Años? ¿Suelo? ¿Nutrición? ¿El dominio de una cepa específica del virus? Comparar dos pacientes no es fácil de responder a estas preguntas. Y en relación con miles de personas, la complejidad de la tarea aumenta muchas veces.

Sin embargo, solo una gran variedad de datos ayudará a comenzar el proceso de estudiar innumerables variaciones de genes y factores ambientales. Cuantos más datos clínicos y genómicos tengan los científicos, mejor y con mayor precisión podrán identificar características comunes en diferentes pacientes.
La genómica a escala de población es miles de millones de piezas de información. Para estudiar el nuevo coronavirus, los científicos esperan comparar el ADN de decenas de miles de pacientes diagnosticados. Esta es una tarea compleja que requiere una gran potencia de procesamiento y alta capacidad, disponible solo en entornos HPC.

Optimización de HPC


¿Recuerdas el "libro" del genoma? ¿La primera lectura que tomó toda una década? Los investigadores ahora analizan el genoma en aproximadamente 150 horas. Esto, por supuesto, es un salto fantástico, pero aún así, esa velocidad no es suficiente para enfrentar la pandemia de COVID-19. Incluso la selección y secuenciación de bits que codifican la estructura de la proteína y el mecanismo de propagación del virus (y estas son varias "páginas" llamadas exomas) generalmente toma al menos 4 horas.

Los investigadores de BGI ahora pueden acceder a los grupos de HPC optimizados para recolectar y analizar cientos de genomas y miles de exomas.
« , BGI , , — - . — : , , ».

Basado en la poderosa solución de Intel, Lenovo ha desarrollado una arquitectura optimizada de hardware y sistema que puede ayudar a reducir drásticamente el tiempo que lleva descifrar un genoma. La herramienta de optimización y escalabilidad genómica de investigación genómica de Lenovo (GOAST) aprovecha el software de código abierto Genome Analysis Toolkit y las plataformas de hardware optimizadas. Elegir los componentes de hardware y software correctos para acelerar la investigación genómica ha requerido la prueba de cientos de configuraciones de HPC.
« , — - . — , . , « », . , , ».

Como resultado, todo el genoma humano se secuencia en cinco horas y media, y exoma en solo cuatro minutos. La aceleración alcanza 40 veces. Con el apoyo de un grupo dedicado de supercomputadoras, los investigadores de BGI pronto comenzarán a trabajar activamente utilizando GOAST para estudiar el nuevo coronavirus y crear una vacuna.

A corto plazo, la predicción de la virulencia basada en cepas dominantes puede ayudar a los hospitales a asignar pacientes de manera más eficiente: sabrán quién está en mayor riesgo y qué tratamientos serán más efectivos. A la larga, además de crear una vacuna, conocer la historia genómica y el origen del virus ayudará a prevenir futuros brotes. En general, este es un rompecabezas increíblemente amplio y complejo que necesita ser resuelto.

Los equipos y tecnologías modernos acelerarán el reconocimiento de las personas infectadas con COVID-19, y el estudio de las características del genoma del virus contribuirá al diagnóstico preciso, el tratamiento exitoso y la prevención de epidemias.

All Articles