JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

二级结构:螺旋与折叠片

在一条蛋白质链折叠成最终那台机器般的形状之前,它的一小段一小段会先卡入两种简单、重复的图案:卷曲的α螺旋和扁平的β折叠片。让我们看看这些形状为何形成、是什么把它们维系在一起,以及如何把任何一个结构读作一幅由螺旋和折叠片组成的布局图。

从一根线条到几种利落的形状

在上一篇指南里,你已经认识了蛋白质的[[primary-structure|一级结构]]:那份赤裸裸的氨基酸清单,沿着单条[[polypeptide-chain|多肽链]]按顺序读出,从 N 端写到 C 端。那是一维的起点——一根又长又软的线。可是一个能干活的蛋白质,是一个精确的三维物体,而形状就是一切。那么,这根线是怎么从扁平的序列变成一台折好的机器的?它并不是一步就跳到那里的。最先发生的事情很小、很局部:链的一小段一小段安顿进了少数几种简单、重复的形状。这一层,就是蛋白质的[[secondary-structure|二级结构]]

想想一件完整的针织毛衣,和构成它的一针一针之间的区别。毛衣是蛋白质整体的折叠;而那一针一针就是它的二级结构——那些重复出现的局部图案,正是用它们缝出更大的形状。令人惊讶的是,地球上几乎每一个蛋白质都只用两种主要的针法:一种卷曲的螺旋,叫[[alpha-helix|α螺旋]];一种打褶的布局,叫[[beta-sheet|β折叠片]];再由叫做转角和环的短连接段把它们接起来。学会认出这两种形状,你就能读懂几乎任何蛋白质结构的骨架。

黏合剂:沿主链的氢键

究竟是什么把这些形状维系住的?答案是[[molbio-hydrogen-bond|氢键]]——正是你在 DNA 两条链配对时认识的那种又弱又可反复使用的吸引力。把目光顺着多肽主链扫过去,你会看到一种规律的图案在每个氨基酸处重复出现:一个能给出氢键的 N-H 基团,和一个能接受氢键的 C=O 基团(羰基)。它们单个都很微弱。但一个氢键就像一条魔术贴的绒毛:撕开毫不费力,可一旦把几十条排在一起,那份抓力就变得相当惊人。

二级结构,说到底就是链想方设法把所有这些主链上的 N-H 和 C=O 基团配成对、让它们各得其所。一个悬在水里、无人搭理的 N-H 或 C=O 是不安分的;链通过把每个给体都贴向一个受体,来降低自己的自由能。用一段由相同重复单元构成的主链来做这件事,在几何上利落的办法本就不多——而α螺旋和β折叠片正是其中最好的两个解。所以这些规则的形状不是装饰:它们是链在解一道化学难题,用尽可能利落的方式把自己那些会形成氢键的基团统统安顿好。

α螺旋:像弹簧一样卷起来的链

想象把链拿起来,卷成一个紧凑的右手螺旋——就像老式电话线的卷曲,或者螺丝的螺纹。这就是α螺旋。链一边卷曲,每个主链上的 C=O 基团一边向上伸出,与沿链再往前数第四个氨基酸的 N-H 基团形成氢键。这些氢键大致平行于螺旋的中轴,像一根卷得紧紧的弹簧的辐条,而每转满一圈大约有 3.6 个氨基酸。结果就是一根坚硬、紧凑的棒。

精妙之处在这里:螺旋内部每一个主链 N-H 和 C=O 都各得其所,与四步之外的伙伴配成了对,所以螺旋的脊柱被氢键完全饱和,十分稳定。而侧链则根本不参与这些氢键——它们像试管刷上的毛一样从螺旋向外支棱出来,可以自由地朝向外面的水,或朝向蛋白质油腻的内部。正是这种朝外的排布,让一段螺旋能够一面亲水、一面亲油,这是蛋白质为了嵌进膜里、或彼此贴合而不断使用的一个把戏。

并不是每一段序列都同样擅长卷曲。有些氨基酸是热衷于形成螺旋的;而有一种——脯氨酸——是出了名的螺旋终结者,因为它的侧链绕回去锁住了主链,使它无法弯进螺旋,而且它没有可供给出的 N-H。脯氨酸常常恰好出现在一段螺旋需要中止或拐弯的地方。这是一个你会不断遇到的深刻观念的第一个苗头:一段链偏好哪种二级结构,受到它序列的影响——不过,正如我们将看到的,那种影响是一种倾向,而非保证。

β折叠片:并排躺着的链段

如果说螺旋是卷成弹簧的链,那么β折叠片就是几乎摊平、来回折叠的链,好让若干段相对笔直的链段——叫β链——像木栈道的木板、或折好的纸扇的褶子那样彼此挨在一起。每一条链段本身都几乎完全伸展,与卷曲恰恰相反。把折叠片维系在一起的氢键并不沿着单条链段走;它们横向延伸,把一条链段的主链架接到相邻链段的主链上。一整排这样的横向键把这些链段像拉链一样拉成一张挺括、略带波纹的片。

相邻的链段可以有两种排列方式,这个区别很重要。当两条链段朝同一个方向走时(两者的 N 到 C 指向一致),折叠片是平行的;当它们朝相反方向走时——像两条朝相反方向行驶的车道——它就是反平行的。反平行的排列让横向键得以笔直而均匀地排开,因此略微更稳定一些;平行的排列则迫使这些键倾斜着走。链常常只是通过一个紧凑的小β转角把自己折回来,就做出了一张反平行折叠片:一条链段伸出去,紧接着的下一条就笔直地折回来、贴着它并排走。

alpha helix (H-bonds run ALONG the chain, i to i+4):

  ...N-H ........ O=C...   one turn bonds to the next, ~3.6 residues/turn

beta sheet, ANTIPARALLEL (H-bonds run ACROSS, strand to strand):

  N--->  C-O...H-N  C-O...H-N  --->C   strand 1
           |   |     |   |
  C<---  N-H...O-C  N-H...O-C  <---N   strand 2
        (the two strands point opposite ways; a beta turn links them)
对同一个问题的两个解——把主链的 N-H 与 C=O 基团配成对。螺旋沿着链配对;折叠片则在相邻链段之间横向配对。

转角、环,以及读懂一个结构

螺旋和折叠片是坚硬、规则的部件——但一个蛋白质不可能全是笔直的棒和扁平的板。总得有东西把它们连起来,并让链改变方向。这些连接段就是转角(非常短,往往只是一个急转弯)和环(更长、不规则、没有重复图案的链段)。它们看上去乱糟糟的,有时被当作填充物而被轻视,但这是个错误:正因为环位于蛋白质的表面、又可以自由地摆出不寻常的形状,它们常常承载着蛋白质真正干活的那一端——那些抓住伙伴或执行催化的残基。规则的部分给出结构;不规则的部分则往往给出功能。

现在,你可以像生物学家那样读一个结构了。把化学细节先放下,把链画成一幅卡通图:螺旋成了螺旋状的丝带,链段成了扁平的箭头(箭头从 N 指向 C),转角和环则成了把它们连起来的细管。一个原本乱成一团的蛋白质,突然就变得可读了——比如说,“三段螺旋贴着一张四链折叠片”。这些形状会以固定的小组合反复出现,这些组合叫做[[structural-motif|结构基序]]:β发夹(两条链段由一个转角相连)、螺旋-转角-螺旋、β-α-β单元。基序就是预制的子组件,更大的折叠正是用它们搭起来的,就像用几种标准的砖砌出无数面墙。

  1. 先找出规则的链段:螺旋状的丝带是α螺旋,扁平的箭头是β链段。
  2. 顺着它们之间的细管——转角和环——描一遍,看看链是按什么顺序逐一造访每个部件的。
  3. 把相邻的箭头归拢成折叠片,并留意它们是平行还是反平行。
  4. 给你认出的那些反复出现的组合起个名——这里一个β发夹,那里一个螺旋-转角-螺旋——这时你读的就是基序了,也就是折叠的构件。

在你继续往上爬之前,有一句诚实的提醒。知道一段链的二级结构,并不能告诉你整个蛋白质长什么样——那是下一级阶梯[[tertiary-structure|三级结构]]的活儿,在那里螺旋和折叠片会装配成一个单一的三维形状。而且,仅凭序列来预测二级结构虽然不错,却并不完美:同一段短肽,在一个蛋白质里可能摆成螺旋,在另一个蛋白质里却摆成链段,因为帮着拿主意的,是它在三维空间里的邻居,而不只是它自己那几个字母。像 AlphaFold 这样的工具已经把结构预测大大改进了,但折叠仍是一个我们在建模、而非彻底解决的问题。