Então, o que é isso, “dobrar proteínas”?



Na atual pandemia do COVID-19, havia muitos problemas que os hackers atacaram com prazer. Desde placas frontais impressas em uma impressora 3D e máscaras médicas caseiras até a substituição de um ventilador mecânico completo, esse fluxo de idéias inspirou e encantou a alma. Ao mesmo tempo, houve tentativas de avançar em outra área: em estudos que visavam combater o próprio vírus.

Aparentemente, a abordagem para tentar chegar à própria fonte do problema tem o maior potencial de interromper a pandemia atual e ficar à frente de todas as subsequentes. Essa abordagem da categoria "reconhecer seu inimigo" professa o projeto de computação Folding @ Home. Milhões de pessoas registradas no projeto e doam parte do poder computacional de seus processadores e GPUs, criando assim o maior supercomputador [distribuído] da história.

Mas para que exatamente todos esses exaflops são usados? Por que é necessário jogar tanto poder computacional no dobramento [empilhamento] de proteínas ? Que bioquímica funciona aqui, por que as proteínas precisam ser empilhadas? Aqui está uma rápida visão geral do dobramento de proteínas: o que é, como ocorre e qual é a sua importância.

Primeiro, a coisa mais importante: por que você precisa de proteínas?


Proteínas são estruturas vitais. Eles não apenas fornecem material de construção para as células, mas também servem como catalisadores de enzimas para quase todas as reações bioquímicas. Proteínas, estruturais ou enzimáticas , são longas cadeias de aminoácidos dispostas em uma sequência específica. As funções das proteínas são determinadas por quais aminoácidos estão localizados em determinados locais da proteína. Se, por exemplo, uma proteína precisar se ligar a uma molécula carregada positivamente, a junção deverá ser preenchida com aminoácidos carregados negativamente.

Para entender como as proteínas obtêm a estrutura que determina sua função, você precisa examinar os princípios básicos da biologia molecular e o fluxo de informações na célula.

A produção ou expressão de proteínas começa com o processo de transcrição . Durante a transcrição, a dupla hélice do DNA, que contém as informações genéticas da célula, se desenrola parcialmente, dando às bases de nitrogênio do DNA acesso a uma enzima chamada RNA polimerase . A tarefa da RNA polimerase é fazer uma cópia do RNA, ou transcrição, de um gene. Essa cópia do gene, chamada RNA mensageiro (mRNA), é uma molécula única, ideal para gerenciar fábricas de proteínas intracelulares, ribossomos que produzem ou traduzem proteínas.

Os ribossomos se comportam como dispositivos de montagem - eles capturam o modelo de mRNA e o mapeiam para outros pequenos pedaços de RNA, transportam o RNA (tRNA). Cada tRNA tem duas regiões ativas - uma seção de três bases chamada anticódon , que deve coincidir com os códons de mRNA correspondentes e um local para a ligação de um aminoácido específico a esse códon . Durante a tradução, as moléculas de tRNA no ribossomo tentam aleatoriamente se ligar ao mRNA usando anticódons. Se bem-sucedida, a molécula de RNAt liga seu aminoácido ao anterior, formando o próximo elo da cadeia de aminoácidos codificada pelo RNAm.

Essa sequência de aminoácidos é o primeiro nível da hierarquia estrutural da proteína e, portanto, é chamadaestrutura primária . Toda a estrutura tridimensional da proteína e suas funções derivam diretamente da estrutura primária e dependem das várias propriedades de cada um dos aminoácidos e de sua interação entre si. Se não fossem essas propriedades químicas e interações dos aminoácidos, os polipeptídeos permaneceriam sequências lineares sem uma estrutura tridimensional. Isso pode ser visto todas as vezes durante o cozimento - nesse processo, a estrutura tridimensional das proteínas é desnaturada termicamente .

Ligações de longo alcance de partes de proteínas


O próximo nível da estrutura tridimensional, que vai além da primária, recebeu o nome engenhoso da estrutura secundária . Inclui ligações de hidrogênio entre aminoácidos de ação relativamente próxima. O ponto principal dessas interações estabilizadoras se resume a duas coisas: uma hélice alfa e uma folha beta . A hélice alfa forma uma porção firmemente torcida do polipeptídeo, e a folha beta forma uma área lisa e larga. Ambas as formações têm propriedades estruturais e funcionais, dependendo das características de seus aminoácidos constituintes. Por exemplo, se a hélice alfa é composta principalmente de aminoácidos hidrofílicos, como arginina ou lisina , é provável que ela participe de reações aquosas.


Espirais alfa e folhas beta em proteínas. As ligações de hidrogênio se formam durante a expressão da proteína.

Essas duas estruturas e suas combinações formam o próximo nível de estrutura proteica - a estrutura terciária . Ao contrário de fragmentos simples de uma estrutura secundária, a estrutura terciária é afetada principalmente pela hidrofobicidade. Os centros da maioria das proteínas contêm aminoácidos altamente hidrofóbicos, como alanina ou metionina, e a água é excluída de lá por causa da natureza "oleosa" dos radicais. Essas estruturas geralmente aparecem em proteínas transmembranares incorporadas nas células circundantes da membrana lipídica dupla. As seções hidrofóbicas das proteínas permanecem termodinamicamente estáveis ​​dentro da parte gordurosa da membrana, e as seções hidrofílicas da proteína são expostas ao ambiente aquático de ambos os lados.

A estabilidade das estruturas terciárias também é fornecida por ligações de longo alcance entre aminoácidos. Uma ponte dissulfeto serve como um exemplo clássico de tais ligações.frequentemente surgindo entre dois radicais cisteína. Se no cabeleireiro, durante o procedimento permanente de enrolamento capilar de algum cliente, você cheirava um pouco a ovos podres, isso significava uma desnaturação parcial da estrutura terciária da queratina contida no cabelo, passando pela redução das ligações dissulfeto usando misturas de tiol contendo enxofre .


A estrutura terciária é estabilizada por interações de longo alcance, como hidrofobicidade ou ligações

dissulfeto, podendo ocorrer ligações dissulfeto entre radicais cisteína na mesma cadeia polipeptídica ou entre cisteínas de diferentes cadeias completas. As interações entre diferentes cadeias formam um quaternárionível de estrutura proteica. Um ótimo exemplo de estrutura quaternária é a hemoglobina no sangue. Cada molécula de hemoglobina consiste em quatro globinas idênticas, partes de uma proteína, cada uma das quais é mantida em uma determinada posição dentro do polipeptídeo por pontes dissulfeto, e também está associada a uma molécula de heme contendo ferro. Todas as quatro globinas são conectadas por pontes dissulfeto intermoleculares, e a molécula inteira se liga inteiramente a várias moléculas de ar ao mesmo tempo, até quatro, e é capaz de liberá-las conforme necessário.

Estruturas de modelagem em busca de uma cura para a doença


As cadeias polipeptídicas começam a se encaixar na forma final durante a tradução, quando a cadeia em crescimento sai do ribossomo - aproximadamente como um pedaço de fio de uma liga com efeito memória pode assumir formas complexas quando aquecido. No entanto, como sempre na biologia, nem tudo é tão simples.

Em muitas células, os genes transcritos sofrem uma edição séria antes da tradução, alterando significativamente a estrutura básica da proteína em comparação com a sequência pura das bases gênicas. Ao mesmo tempo, os mecanismos de tradução são frequentemente recrutados pelo uso de proteínas moleculares acompanhantes, ligando-se temporariamente à cadeia polipeptídica nascente e impedindo-a de assumir qualquer forma intermediária, da qual eles serão incapazes de avançar para a final.

Tudo isso porque prever a forma final de uma proteína não é uma tarefa trivial. Durante décadas, a única maneira de estudar a estrutura das proteínas era com métodos físicos, como cristalografia de raios-X. Somente no final da década de 1960, os químicos biofísicos começaram a construir modelos computacionais de dobragem de proteínas, concentrando-se principalmente na modelagem da estrutura secundária. Esses métodos e seus descendentes exigem grandes quantidades de dados de entrada, além da estrutura primária - por exemplo, tabelas de ângulos de ligação de aminoácidos, listas de hidrofobicidade, estados carregados e até preservação e funcionamento da estrutura em intervalos de tempo evolutivos - e tudo para adivinhar como será olhe a proteína final.

Os métodos computacionais de hoje para prever a estrutura secundária, trabalhando principalmente na rede Folding @ Home, funcionam com aproximadamente 80% de precisão - o que é bastante bom, dada a complexidade da tarefa. Os dados obtidos por modelos preditivos para proteínas como a proteína spike SARS-CoV-2 serão comparados com dados de um estudo físico do vírus. Como resultado, será possível obter a estrutura exata da proteína e, possivelmente, entender como o vírus se liga aos receptores da enzima conversora de angiotensina 2 da pessoa localizada no trato respiratório que leva ao corpo. Se conseguirmos entender essa estrutura, provavelmente seremos capazes de encontrar drogas que bloqueiem a ligação e previnam a infecção.

A pesquisa sobre dobragem de proteínas está no cerne de nossa compreensão de tantas doenças e infecções que, mesmo quando usamos o Folding @ Home para descobrir como vencer o COVID-19, cujo crescimento explosivo temos observado recentemente, essa rede não fica ociosa por muito tempo. trabalhos. Esta é uma ferramenta de pesquisa excelente para estudar os modelos de proteínas subjacentes a dezenas de doenças associadas ao dobramento inadequado de proteínas - por exemplo, a doença de Alzheimer ou uma variante da doença de Creutzfeldt-Jakob, que muitas vezes é chamada incorretamente de doença da vaca louca. E quando outro vírus aparecer inevitavelmente, estaremos prontos para começar uma briga com ele novamente.

All Articles