Supercomputadores, sequenciamento de genoma e as perspectivas de derrotar o coronavírus

Justin Er, gerente de comunicações globais

Uma gota de fluido que uma pessoa exala pode conter bilhões de partículas de coronavírus. Em cada um deles, com certas variações, haverá cerca de 30.000 nucleotídeos de DNA. Este é um indicador da densidade do genoma viral, responsável por cada característica e característica específica do vírus - de sua virulência a mecanismos de transmissão. Pesquisadores da China e de outros países do mundo já identificaram várias seqüências genômicas do novo coronavírus SARS-CoV-2, fornecendo aos cientistas e médicos conhecimentos básicos para iniciar a luta contra a infecção.



Minuto de Cuidados com OVNI


COVID-19 — , SARS-CoV-2 (2019-nCoV). — , /, .



, .

, , .

: |

Mas o mapeamento dos genomas de coronavírus é apenas o começo do trabalho. Exponencialmente mais complexo e igualmente importante para entender a natureza de uma pandemia é determinar a sequência dos genomas das pessoas infectadas. Isso levanta muitas questões: por que um vírus é mais contagioso do que outros? Quais mecanismos levam ao desenvolvimento de pneumonia em alguns pacientes e apenas uma tosse leve em outros? Como os pacientes individuais respondem a diferentes tratamentos ou vacinas?

É necessário buscar respostas no campo da interação entre o genoma humano e as cepas de vírus. A compreensão desse processo no nível do DNA abre caminho para o diagnóstico de doenças, o desenvolvimento de vacinas antivirais e imunoterapia.



Pesquisadores da BGI Genomics, que desenvolveram os primeiros kits de teste de diagnóstico para a detecção da doença de COVID-19, estão envolvidos em trabalhos meticulosos e em larga escala para decifrar o genoma do novo coronavírus. Para desenvolver uma vacina eficaz, os cientistas precisam de enormes conjuntos de dados para identificar diferenças genéticas e criar proteção potencial. Com uma operação em larga escala, são gerados terabytes e petabytes de dados, com o processamento e a análise com os quais somente os sistemas de computação de alto desempenho (HPC) podem lidar .

A velocidade do seqüenciamento do genoma está crescendo junto com o crescimento do poder da computação. Um processo que originalmente levou mais de dez anose custo de bilhões, agora você pode executar em apenas algumas horas clusters de supercomputadores executando na arquitetura de hardware otimizada. Os pesquisadores enfatizam que o caminho para a criação de uma vacina provavelmente será longo , mas esse conjunto de ferramentas sem precedentes ajudará a reduzir o tempo.


"Para analisar e identificar as complicações de uma infecção viral, a BGI Genomics sequenciou centenas de amostras clínicas", disse Xiangqin Jin, CTO da BGI Genomics. "O acesso à mais recente tecnologia em computação de alto desempenho e análise genômica é um fator importante para melhorar a eficiência da análise."


Pesquisador da BGI Genomics trabalha com o sequenciador T7

Desejando apoiar a BGI e expandir os recursos dos pesquisadores da COVID-19, Intel e Lenovo uniram forças. Eles apresentaram aos cientistas um cluster de supercomputadores e também ofereceram seus conhecimentos no campo de software e hardware para o uso mais eficiente.
"Estamos tentando o nosso melhor para apoiar cientistas e médicos que estão na vanguarda da luta contra o novo coronavírus", explica Milidi Giraldo, principal especialista em pesquisa e desenvolvimento genômico da Lenovo.


A tecnologia que a Intel e a Lenovo forneceram para a BGI inclui um cluster HPC para processar operações de leitura de alto desempenho a partir do seqüenciador BGI DNBSEQ-T7.

O Dr. Giraldo trabalha em pesquisa de bioinformática nos Institutos Nacionais de Saúde (NIH) há vários anos, contribuindo para o desenvolvimento de vacinas para combater doenças infecciosas. Agora, ajuda a promover a interação entre cientistas e engenheiros que desenvolvem hardware e software para o setor de ciências naturais.
"Doamos equipamentos e oferecemos nossa experiência, mas os pesquisadores da BGI e outros representantes da comunidade biomédica fornecerão uma verdadeira inovação".

O cluster HPC estudará virulência, padrões de transmissão de patógenos e interações entre o hospedeiro e o vírus. Como resultado deste trabalho, a BGI espera otimizar seus kits de diagnóstico COVID-19, adquirir muito conhecimento sobre o coronavírus, acelerar o desenvolvimento de uma vacina eficaz ou outras medidas de proteção - por exemplo, imunoterapia.

Decodificação do genoma


O genoma de todas as pessoas na Terra pode ser pensado como um livro com mil páginas. Mas seu texto incomum conterá apenas quatro letras: AGCT. Eles denotam uma combinação de nucleotídeos no DNA e contêm instruções para cada característica, cada recurso que faz de você quem você é: determina a cor do cabelo, a altura e até a suscetibilidade a uma doença como COVID-19. A maioria dessas instruções é escrita da mesma forma para todas as pessoas, mas as variações mais importantes estão ocultas em apenas algumas páginas.



Para entender como uma pessoa é suscetível à infecção, os pesquisadores devem identificar as “páginas” exatas (isto é, genes) com instruções apropriadas. Isso só pode ser feito comparando as “páginas” do maior número possível de pacientes - com a identificação de características gerais e o uso subsequente de dados que vinculam essas variações à resposta à infecção.

Ao sequenciar um genoma, é preciso levar em consideração que 1 ml de uma amostra biológica geralmente contém milhões de virions diferentes, e cada um deles, por sua vez, possui um genoma com aproximadamente 30.000 nucleotídeos de DNA.

Essa tarefa extremamente difícil de decodificar e interpretar o genoma está no centro da luta dos cientistas com o novo coronavírus. A compreensão da interação entre os genes humanos correspondentes e o SARS-CoV-2 pode revelar maneiras de conter ou parar completamente a infecção. Os cientistas também procurarão "páginas" comuns no livro do próprio coronavírus - para identificar áreas do genoma nas quais o patógeno não pode transferir mutações. Este é um tipo de calcanhar de Aquiles, que pode abrir o caminho para a criação de uma vacina ou a busca de tratamento.

Desenvolvimento de vacinas


Nos filmes sobre epidemias, via de regra, há um momento em que os cientistas caçam a única pessoa imune à doença. Isso faz algum sentido: a imunidade natural pode fornecer uma visão importante sobre as formas de desenvolver uma vacina eficaz.

«, , — . — , , . , , . , , — ».



O coronavírus coroa um anel de espinhos em forma de coroa, que determinou seu nome.

Considere duas respostas dos pacientes ao vírus: uma desenvolve pneumonia com risco de vida e a outra apenas tosse leve. O que explica essas diferenças? Imunidade reduzida? Predisposição genética? Consequências de outra doença passada? Era? Chão? Nutrição? O domínio de uma cepa específica do vírus? Comparar dois pacientes não é fácil de responder a essas perguntas. E em relação a milhares de pessoas, a complexidade da tarefa aumenta muitas vezes.

No entanto, apenas uma enorme variedade de dados ajudará a iniciar o processo de estudo de inúmeras variações de genes e fatores ambientais. Quanto mais dados clínicos e genômicos os cientistas tiverem, melhor e com mais precisão eles serão capazes de identificar características comuns em diferentes pacientes.
A genômica em escala populacional é de bilhões de informações. Para estudar o novo coronavírus, os cientistas esperam comparar o DNA de dezenas de milhares de pacientes diagnosticados. Essa é uma tarefa complexa que requer grande poder de processamento e alta capacidade, disponível apenas em ambientes HPC.

Otimização HPC


Lembra do "livro" do genoma? Aquele cuja primeira leitura levou uma década inteira? Os pesquisadores agora analisam o genoma em cerca de 150 horas. É claro que este é um salto fantástico, mas ainda assim, essa velocidade não é suficiente para lidar com a pandemia do COVID-19. Até a seleção e o sequenciamento de bits que codificam a estrutura da proteína e o mecanismo de propagação do vírus (e essas são várias "páginas" chamadas exomas) geralmente levam pelo menos 4 horas.

Os pesquisadores da BGI agora podem acessar clusters de HPC otimizados para coletar e analisar centenas de genomas e milhares de exomas.
« , BGI , , — - . — : , , ».

Com base na poderosa solução da Intel, a Lenovo desenvolveu uma arquitetura otimizada de hardware e sistema que pode ajudar a reduzir drasticamente o tempo necessário para descriptografar um genoma. A Ferramenta de Otimização e Escalabilidade Genômica em Pesquisa Genômica da Lenovo (GOAST) da Lenovo aproveita o software de código-fonte Genome Analysis Toolkit e as plataformas de hardware otimizadas. A escolha dos componentes corretos de hardware e software para acelerar a pesquisa genômica exigiu o teste de centenas de configurações de HPC.
« , — - . — , . , « », . , , ».

Como resultado, todo o genoma humano é sequenciado em cinco horas e meia e exom em apenas quatro minutos. A aceleração atinge 40 vezes. Apoiados por um cluster de supercomputadores dedicado, os pesquisadores da BGI em breve iniciarão um trabalho ativo usando o GOAST para estudar o novo coronavírus e criar uma vacina.

A curto prazo, prever a virulência com base em cepas dominantes pode ajudar os hospitais a alocar pacientes com mais eficiência - eles saberão quem está em maior risco e quais tratamentos serão mais eficazes. A longo prazo, além de criar uma vacina, conhecer a história genômica e a origem do vírus ajudará a prevenir futuros surtos. Em geral, esse é um quebra-cabeça incrivelmente amplo e complexo que precisa ser resolvido.

Equipamentos e tecnologias modernas acelerarão o reconhecimento de pessoas infectadas com COVID-19, e o estudo das características do genoma do vírus contribuirá para o diagnóstico preciso, o sucesso do tratamento e a prevenção de epidemias.

All Articles