那么,“蛋白质折叠”到底是什么呢?



在当前的COVID-19大流行中,黑客很乐意攻击许多问题。从在3D打印机上打印的面板和自制的医用口罩,到更换成熟的机械呼吸机,这些灵感源源不断,激发了人们的灵魂。同时,有人尝试在另一个领域取得进展:旨在对抗病毒本身的研究。

显然,试图从根本上解决问题的方法具有最大的潜力,可以阻止当前的大流行并领先于所有后续大流行。“识别您的敌人”类别中的这种方法适用于计算项目Folding @ Home。数以百万计的人已经在该项目中注册,并捐赠了其处理器和GPU的部分计算能力,从而创造了历史上最大的[分布式]超级计算机。

但是这些exaflops到底是用来做什么的呢?为什么需要对蛋白质的折叠[堆积]赋予这种计算能力什么生物化学在这里起作用,为什么蛋白质需要堆叠?这是蛋白质折叠的快速概述:它是什么,它如何发生以及其重要性是什么。

首先,最重要的是:为什么需要蛋白质?


蛋白质是至关重要的结构。它们不仅为细胞提供了建筑材料,而且还充当了几乎所有生化反应的酶催化剂。蛋白质,无论是结构性的还是酶促的,都是按特定顺序排列氨基酸长链。蛋白质的功能由位于蛋白质某些位置的氨基酸决定。例如,如果蛋白质需要结合带正电荷的分子,则连接处应充满带负电荷的氨基酸。

要了解蛋白质如何获得决定其功能的结构,您需要了解分子生物学的基础知识以及细胞中的信息流。

蛋白质的 生产或表达始于转录过程。在转录过程中,DNA的双螺旋(包含细胞的遗传信息)部分解开,使DNA的氮碱基可进入一种称为RNA聚合酶的酶。 RNA聚合酶的任务是产生基因的RNA复制或转录。该基因的副本称为信使RNA(mRNA),是一个单分子,非常适合管理细胞内蛋白质工厂,产生或翻译蛋白质的核糖体

核糖体的行为就像装配设备一样-它们捕获mRNA模板并将其与其他小RNA片段匹配,从而转运RNA(tRNA)。每个tRNA都有两个活性区域-称为反密码子的三碱基部分,应与相应的mRNA密码子重合,以及一个与该密码子特异的氨基酸结合的位点。在翻译过程中,核糖体中的tRNA分子随机尝试使用反密码子与mRNA结合。如果成功,则tRNA分子会将其氨基酸连接至前一个氨基酸,从而在mRNA编码的氨基酸链中形成下一个链接。

该氨基酸序列是蛋白质结构层次结构的第一级,因此被称为基本结构蛋白质的整个三维结构及其功能直接源自一级结构,并取决于每种氨基酸的各种特性及其相互之间的相互作用。如果不是由于这些化学性质和氨基酸的相互作用,则多肽将保持线性序列而没有三维结构。每次烹饪时都可以看到这一点-在此过程中,蛋白质的三维结构被热变性

蛋白质部分的长距离键


三维结构的下一层超越了一级结构,被赋予了二级结构的巧妙名称。它包括作用相对紧密的氨基酸之间的氢键。这些稳定相互作用的要点归结为两点:α螺旋β折叠。 α螺旋形成多肽的紧密扭曲部分,而β折叠形成平滑且宽阔的区域。这两种形成都具有结构和功能特性,这取决于其组成氨基酸的特性。例如,如果α螺旋主要由亲水氨基酸组成,如精氨酸赖氨酸,则很可能参与水相反应。


蛋白质中的α螺旋和β折叠。在蛋白质表达过程中形成氢键。

这两个结构及其组合构成了蛋白质结构的下一个层次- 三级结构。与二级结构的简单片段不同,三级结构主要受疏水性影响。大多数蛋白质的中心都含有高度疏水的氨基酸,例如丙氨酸蛋氨酸,并且由于自由基的“油腻”性质,水被排除在外。这些结构通常出现在包埋在细胞周围的双脂质膜中的跨膜蛋白中。蛋白质的疏水部分在膜的脂肪部分内部保持热力学稳定,蛋白质的亲水部分从两侧暴露于水生环境。

氨基酸之间的长距离键也提供了三级结构的稳定性。二硫键是此类键的经典示例。通常在两个半胱氨酸自由基之间产生。如果在某些客户的永久性卷发过程中,在美发师那里闻到的鸡蛋有点像烂鸡蛋,那么这就是头发中所含角蛋白三级结构的部分变性,这是通过使用含硫的硫醇混合物还原了二硫键而实现的


三级结构通过长距离相互作用(例如疏水性或二硫键)得以稳定,

二硫键可以出现在同一条多肽链中的半胱氨酸基团之间,或不同完整链中的半胱氨酸之间。不同链之间的相互作用形成四元蛋白质结构水平。血液中血红蛋白是四元结构的一个很好的例子每个血红蛋白分子由四个相同的球蛋白组成,它们是蛋白质的一部分,每个蛋白通过二硫键固定在多肽内部的某个位置,并且还与含铁的血红素分子相关。所有四个球蛋白都通过分子间二硫键连接,整个分子一次最多与四个空气分子完全结合,并能够根据需要释放它们。

寻找可治愈疾病的模型结构


当增长的链离开核糖体时,多肽链开始在翻译过程中适应最终形式,大约是一条记忆合金丝在加热时如何呈复杂形式。但是,与生物学一样,一切并非如此简单。

在许多细胞中,转录的基因在翻译前会经过认真的编辑,与基因碱基的纯序列相比,大大改变了蛋白质的基本结构。同时,通常通过使用分子伴随蛋白来争取翻译机制,所述分子伴随蛋白暂时结合到新生的多肽链上,并且不允许其采取任何中间形式,因此它们将无法继续进行最终的合成。

这是因为预测蛋白质的最终形式并非易事。几十年来,研究蛋白质结构的唯一方法是使用物理方法,例如X射线晶体学。仅在1960年代后期,生物物理化学家才开始建立蛋白质折叠的计算模型,主要集中于对二级结构进行建模。这些方法及其后代除了主要结构外还需要大量输入数据,例如,氨基酸键角表,疏水性列表,带电状态,甚至结构保存以及在进化时间间隔上起作用,所有这些都是为了猜测它将如何看最终的蛋白质。

如今,用于预测二级结构的计算方法(特别是在Folding @ Home网络中)可以以大约80%的精度工作-考虑到任务的复杂性,这非常好。通过蛋白质(例如SARS-CoV-2穗突蛋白)的预测模型获得的数据将与该病毒的物理研究数据进行比较。结果,将有可能获得蛋白质的确切结构,并且有可能理解病毒如何附着于位于通向人体的呼吸道中的血管紧张素转化酶2的受体。如果我们能够理解这种结构,我们将可能能够找到阻断结合并防止感染的药物。

对蛋白质折叠的研究是我们了解众多疾病和感染的核心,即使我们使用Folding @ Home来弄清楚如何击败COVID-19(我们最近一直在观察其爆炸性增长),该网络也不会长期处于闲置状态工作。这是一种出色的研究工具,可用于研究蛋白质模型,这些蛋白质模型是数十种与蛋白质折叠不当相关的疾病的基础,例如,阿尔茨海默氏病或​​Creutzfeldt-Jakob病的变种,通常被错误地称为疯牛病。当不可避免地出现另一种病毒时,我们将准备再次与它作斗争。

All Articles