Alors, de quoi s'agit-il, le «repliement des protéines»?



Dans la pandémie actuelle de COVID-19, de nombreux problèmes ont été attaqués par des pirates informatiques. Des façades imprimées sur une imprimante 3D et des masques médicaux faits maison au remplacement d'un ventilateur mécanique à part entière, ce flux d'idées a inspiré et ravi l'âme. Parallèlement, il y a eu des tentatives de progresser dans un autre domaine: des études visant à lutter contre le virus lui-même.

Apparemment, l'approche pour essayer de trouver la source même du problème a le plus grand potentiel d'arrêter la pandémie actuelle et de devancer toutes les suivantes. Cette approche de la catégorie «reconnaître votre ennemi» professe le projet informatique Folding @ Home. Des millions de personnes se sont inscrites au projet et donnent une partie de la puissance de calcul de leurs processeurs et GPU, créant ainsi le plus grand supercalculateur [distribué] de l'histoire.

Mais à quoi servent exactement tous ces exaflops? Pourquoi est-il nécessaire de jeter une telle puissance de calcul sur le pliage [empilement] de protéines ? Quelle biochimie fonctionne ici, pourquoi les protéines doivent-elles être empilées? Voici un bref aperçu du repliement des protéines: de quoi il s'agit, comment il se produit et quelle est son importance.

Tout d'abord, la chose la plus importante: pourquoi avez-vous besoin de protéines?


Les protéines sont des structures vitales. Ils fournissent non seulement des matériaux de construction pour les cellules, mais servent également d'enzymes-catalyseurs pour presque toutes les réactions biochimiques. Les protéines, qu'elles soient structurales ou enzymatiques , sont de longues chaînes d' acides aminés disposées selon une séquence spécifique. Les fonctions des protéines sont déterminées par les acides aminés situés à certains endroits de la protéine. Si, par exemple, une protéine doit se lier à une molécule chargée positivement, la jonction doit être remplie d'acides aminés chargés négativement.

Pour comprendre comment les protéines obtiennent la structure qui détermine leur fonction, vous devez passer en revue les bases de la biologie moléculaire et le flux d'informations dans la cellule.

La production ou l' expression des protéines commence par le processus de transcription . Pendant la transcription, la double hélice d'ADN, qui contient les informations génétiques de la cellule, se déroule partiellement, donnant aux bases azotées de l'ADN l'accès à une enzyme appelée ARN polymérase . La tâche de l'ARN polymérase est de faire une copie d'ARN, ou transcription, d'un gène. Cette copie du gène, appelée ARN messager (ARNm), est une molécule unique, idéale pour gérer les usines de protéines intracellulaires, les ribosomes qui produisent ou traduisent des protéines.

Les ribosomes se comportent comme des dispositifs d'assemblage - ils capturent le modèle d'ARNm et le mappent à d'autres petits morceaux d'ARN, transportant l'ARN (ARNt). Chaque ARNt a deux régions actives - une section à trois bases appelée anticodon , qui devrait coïncider avec les codons d'ARNm correspondants, et un site pour la liaison d'un acide aminé spécifique pour ce codon . Au cours de la traduction, les molécules d'ARNt dans le ribosome tentent de se lier au hasard à l'ARNm à l'aide d'anticodons. En cas de succès, la molécule d'ARNt attache son acide aminé au précédent, formant le lien suivant dans la chaîne d'acides aminés codée par l'ARNm.

Cette séquence d'acides aminés est le premier niveau de la hiérarchie structurelle de la protéine, et donc elle est appeléestructure primaire . La structure tridimensionnelle entière de la protéine et ses fonctions dérivent directement de la structure primaire et dépendent des diverses propriétés de chacun des acides aminés et de leur interaction les uns avec les autres. Sans ces propriétés chimiques et interactions des acides aminés, les polypeptides resteraient des séquences linéaires sans structure tridimensionnelle. Cela peut être vu à chaque fois pendant la cuisson - dans ce processus, la structure tridimensionnelle des protéines est dénaturée thermiquement .

Liaisons à longue portée de parties de protéines


Le niveau suivant de la structure tridimensionnelle, qui va au-delà du primaire, a reçu le nom ingénieux de la structure secondaire . Il comprend des liaisons hydrogène entre des acides aminés d'action relativement proche. Le point principal de ces interactions stabilisantes se résume à deux choses: une hélice alpha et une feuille bêta . L'hélice alpha forme une partie étroitement torsadée du polypeptide et la feuille bêta forme une zone lisse et large. Les deux formations ont à la fois des propriétés structurelles et fonctionnelles, selon les caractéristiques de leurs acides aminés constitutifs. Par exemple, si l'hélice alpha est principalement composée d'acides aminés hydrophiles, comme l' arginine ou la lysine , elle est susceptible de participer à des réactions aqueuses.


Spirales alpha et feuilles bêta dans les protéines. Des liaisons hydrogène se forment lors de l'expression des protéines.

Ces deux structures et leurs combinaisons forment le prochain niveau de structure protéique - la structure tertiaire . Contrairement aux simples fragments d'une structure secondaire, la structure tertiaire est principalement affectée par l'hydrophobicité. Les centres de la plupart des protéines contiennent des acides aminés hautement hydrophobes tels que l' alanine ou la méthionine, et l'eau en est exclue en raison de la nature "grasse" des radicaux. Ces structures apparaissent souvent dans les protéines transmembranaires intégrées dans la double membrane lipidique entourant les cellules. Les sections hydrophobes de protéines restent thermodynamiquement stables à l'intérieur de la partie grasse de la membrane, et les sections hydrophiles de la protéine sont exposées au milieu aquatique des deux côtés.

La stabilité des structures tertiaires est également assurée par des liaisons à longue distance entre les acides aminés. Un pont disulfure sert d'exemple classique de telles liaisons.apparaissant souvent entre deux radicaux cystéine. Si chez le coiffeur pendant la procédure de bouclage permanent des cheveux de certains clients, vous sentiez un peu comme des œufs pourris, alors c'était une dénaturation partielle de la structure tertiaire de la kératine contenue dans les cheveux, en passant par la réduction des liaisons disulfures en utilisant des mélanges de thiol contenant du soufre .


La structure tertiaire est stabilisée par des interactions à longue portée, telles que l'hydrophobicité ou les liaisons disulfure.Des liaisons

disulfure peuvent se produire entre les radicaux cystéine dans la même chaîne polypeptidique, ou entre les cystéines de différentes chaînes complètes. Les interactions entre différentes chaînes forment un quaternaireniveau de la structure des protéines. L' hémoglobine dans votre sang est un excellent exemple de structure quaternaire . Chaque molécule d'hémoglobine se compose de quatre globines identiques, parties d'une protéine, dont chacune est maintenue dans une certaine position à l'intérieur du polypeptide par des ponts disulfures, et est également associée à une molécule d'hème contenant du fer. Les quatre globines sont reliées par des ponts disulfures intermoléculaires, et la molécule entière se lie entièrement à plusieurs molécules d'air à la fois, jusqu'à quatre, et est capable de les libérer si nécessaire.

Modéliser les structures à la recherche d'un remède contre la maladie


Les chaînes de polypeptides commencent à s'intégrer dans la forme finale pendant la traduction, lorsque la chaîne en croissance quitte le ribosome - approximativement comment un morceau de fil en alliage à mémoire peut prendre des formes complexes lorsqu'il est chauffé. Cependant, comme toujours en biologie, tout n'est pas si simple.

Dans de nombreuses cellules, les gènes transcrits subissent une modification sérieuse avant la traduction, modifiant de manière significative la structure de base de la protéine par rapport à la séquence pure des bases géniques. Dans le même temps, les mécanismes de traduction sont souvent mobilisés par l'utilisation de protéines d'accompagnement moléculaire, se liant temporairement à la chaîne polypeptidique naissante et l'empêchant de prendre toute forme intermédiaire, à partir de laquelle ils ne pourront alors pas passer à la dernière.

C'est tout parce que prédire la forme finale d'une protéine n'est pas une tâche triviale. Pendant des décennies, la seule façon d'étudier la structure des protéines était d'utiliser des méthodes physiques telles que la cristallographie aux rayons X. Ce n'est qu'à la fin des années 1960 que les chimistes biophysiciens ont commencé à construire des modèles informatiques de repliement des protéines, se concentrant principalement sur la modélisation de la structure secondaire. Ces méthodes et leurs descendants nécessitent d'énormes volumes de données d'entrée en plus de la structure principale - par exemple, des tableaux d'angles de liaison d'acides aminés, des listes d'hydrophobicité, des états chargés et même la préservation et le fonctionnement de la structure à des intervalles de temps évolutifs - et tout cela pour deviner comment cela sera regardez la protéine finale.

Les méthodes de calcul actuelles pour prédire la structure secondaire, fonctionnant en particulier dans le réseau Folding @ Home, fonctionnent avec une précision d'environ 80% - ce qui est plutôt bien, compte tenu de la complexité de la tâche. Les données obtenues par des modèles prédictifs de protéines telles que la protéine de pointe SARS-CoV-2 seront comparées aux données d'une étude physique du virus. En conséquence, il sera possible d'obtenir la structure exacte de la protéine et, éventuellement, de comprendre comment le virus se fixe aux récepteurs de l' enzyme de conversion de l' angiotensine 2 de la personne située dans les voies respiratoires menant au corps. Si nous pouvons comprendre cette structure, nous serons probablement en mesure de trouver des médicaments qui bloquent la liaison et empêchent l'infection.

La recherche sur le repliement des protéines est au cœur même de notre compréhension de tant de maladies et d'infections que même lorsque nous utilisons Folding @ Home pour comprendre comment battre COVID-19, dont nous avons observé récemment la croissance explosive, ce réseau ne restera pas longtemps inactif travail. Il s'agit d'un outil de recherche qui est excellent pour étudier les modèles de protéines qui sous-tendent des dizaines de maladies associées à un mauvais repliement des protéines - par exemple, la maladie d'Alzheimer ou une variante de la maladie de Creutzfeldt-Jakob, qui est souvent appelée à tort la maladie de la vache folle. Et lorsqu'un autre virus apparaîtra inévitablement, nous serons prêts à recommencer un combat avec lui.

All Articles