二级结构：螺旋与折叠片

从一根线条到几种利落的形状

在上一篇指南里，你已经认识了蛋白质的[[primary-structure|一级结构]]：那份赤裸裸的氨基酸清单，沿着单条[[polypeptide-chain|多肽链]]按顺序读出，从 N 端写到 C 端。那是一维的起点——一根又长又软的线。可是一个能干活的蛋白质，是一个精确的三维物体，而形状就是一切。那么，这根线是怎么从扁平的序列变成一台折好的机器的？它并不是一步就跳到那里的。最先发生的事情很小、很局部：链的一小段一小段安顿进了少数几种简单、重复的形状。这一层，就是蛋白质的[[secondary-structure|二级结构]]。

想想一件完整的针织毛衣，和构成它的一针一针之间的区别。毛衣是蛋白质整体的折叠；而那一针一针就是它的二级结构——那些重复出现的局部图案，正是用它们缝出更大的形状。令人惊讶的是，地球上几乎每一个蛋白质都只用两种主要的针法：一种卷曲的螺旋，叫[[alpha-helix|α螺旋]]；一种打褶的布局，叫[[beta-sheet|β折叠片]]；再由叫做转角和环的短连接段把它们接起来。学会认出这两种形状，你就能读懂几乎任何蛋白质结构的骨架。

黏合剂：沿主链的氢键

究竟是什么把这些形状维系住的？答案是[[molbio-hydrogen-bond|氢键]]——正是你在 DNA 两条链配对时认识的那种又弱又可反复使用的吸引力。把目光顺着多肽主链扫过去，你会看到一种规律的图案在每个氨基酸处重复出现：一个能给出氢键的 N-H 基团，和一个能接受氢键的 C=O 基团（羰基）。它们单个都很微弱。但一个氢键就像一条魔术贴的绒毛：撕开毫不费力，可一旦把几十条排在一起，那份抓力就变得相当惊人。

二级结构，说到底就是链想方设法把所有这些主链上的 N-H 和 C=O 基团配成对、让它们各得其所。一个悬在水里、无人搭理的 N-H 或 C=O 是不安分的；链通过把每个给体都贴向一个受体，来降低自己的自由能。用一段由相同重复单元构成的主链来做这件事，在几何上利落的办法本就不多——而α螺旋和β折叠片正是其中最好的两个解。所以这些规则的形状不是装饰：它们是链在解一道化学难题，用尽可能利落的方式把自己那些会形成氢键的基团统统安顿好。

α螺旋：像弹簧一样卷起来的链

想象把链拿起来，卷成一个紧凑的右手螺旋——就像老式电话线的卷曲，或者螺丝的螺纹。这就是α螺旋。链一边卷曲，每个主链上的 C=O 基团一边向上伸出，与沿链再往前数第四个氨基酸的 N-H 基团形成氢键。这些氢键大致平行于螺旋的中轴，像一根卷得紧紧的弹簧的辐条，而每转满一圈大约有 3.6 个氨基酸。结果就是一根坚硬、紧凑的棒。

精妙之处在这里：螺旋内部每一个主链 N-H 和 C=O 都各得其所，与四步之外的伙伴配成了对，所以螺旋的脊柱被氢键完全饱和，十分稳定。而侧链则根本不参与这些氢键——它们像试管刷上的毛一样从螺旋向外支棱出来，可以自由地朝向外面的水，或朝向蛋白质油腻的内部。正是这种朝外的排布，让一段螺旋能够一面亲水、一面亲油，这是蛋白质为了嵌进膜里、或彼此贴合而不断使用的一个把戏。

并不是每一段序列都同样擅长卷曲。有些氨基酸是热衷于形成螺旋的；而有一种——脯氨酸——是出了名的螺旋终结者，因为它的侧链绕回去锁住了主链，使它无法弯进螺旋，而且它没有可供给出的 N-H。脯氨酸常常恰好出现在一段螺旋需要中止或拐弯的地方。这是一个你会不断遇到的深刻观念的第一个苗头：一段链偏好哪种二级结构，受到它序列的影响——不过，正如我们将看到的，那种影响是一种倾向，而非保证。

β折叠片：并排躺着的链段

如果说螺旋是卷成弹簧的链，那么β折叠片就是几乎摊平、来回折叠的链，好让若干段相对笔直的链段——叫β链——像木栈道的木板、或折好的纸扇的褶子那样彼此挨在一起。每一条链段本身都几乎完全伸展，与卷曲恰恰相反。把折叠片维系在一起的氢键并不沿着单条链段走；它们横向延伸，把一条链段的主链架接到相邻链段的主链上。一整排这样的横向键把这些链段像拉链一样拉成一张挺括、略带波纹的片。

相邻的链段可以有两种排列方式，这个区别很重要。当两条链段朝同一个方向走时（两者的 N 到 C 指向一致），折叠片是平行的；当它们朝相反方向走时——像两条朝相反方向行驶的车道——它就是反平行的。反平行的排列让横向键得以笔直而均匀地排开，因此略微更稳定一些；平行的排列则迫使这些键倾斜着走。链常常只是通过一个紧凑的小β转角把自己折回来，就做出了一张反平行折叠片：一条链段伸出去，紧接着的下一条就笔直地折回来、贴着它并排走。

alpha helix (H-bonds run ALONG the chain, i to i+4):

  ...N-H ........ O=C...   one turn bonds to the next, ~3.6 residues/turn

beta sheet, ANTIPARALLEL (H-bonds run ACROSS, strand to strand):

  N--->  C-O...H-N  C-O...H-N  --->C   strand 1
           |   |     |   |
  C<---  N-H...O-C  N-H...O-C  <---N   strand 2
        (the two strands point opposite ways; a beta turn links them)

对同一个问题的两个解——把主链的 N-H 与 C=O 基团配成对。螺旋沿着链配对；折叠片则在相邻链段之间横向配对。

转角、环，以及读懂一个结构

螺旋和折叠片是坚硬、规则的部件——但一个蛋白质不可能全是笔直的棒和扁平的板。总得有东西把它们连起来，并让链改变方向。这些连接段就是转角（非常短，往往只是一个急转弯）和环（更长、不规则、没有重复图案的链段）。它们看上去乱糟糟的，有时被当作填充物而被轻视，但这是个错误：正因为环位于蛋白质的表面、又可以自由地摆出不寻常的形状，它们常常承载着蛋白质真正干活的那一端——那些抓住伙伴或执行催化的残基。规则的部分给出结构；不规则的部分则往往给出功能。

现在，你可以像生物学家那样读一个结构了。把化学细节先放下，把链画成一幅卡通图：螺旋成了螺旋状的丝带，链段成了扁平的箭头（箭头从 N 指向 C），转角和环则成了把它们连起来的细管。一个原本乱成一团的蛋白质，突然就变得可读了——比如说，“三段螺旋贴着一张四链折叠片”。这些形状会以固定的小组合反复出现，这些组合叫做[[structural-motif|结构基序]]：β发夹（两条链段由一个转角相连）、螺旋-转角-螺旋、β-α-β单元。基序就是预制的子组件，更大的折叠正是用它们搭起来的，就像用几种标准的砖砌出无数面墙。

先找出规则的链段：螺旋状的丝带是α螺旋，扁平的箭头是β链段。
顺着它们之间的细管——转角和环——描一遍，看看链是按什么顺序逐一造访每个部件的。
把相邻的箭头归拢成折叠片，并留意它们是平行还是反平行。
给你认出的那些反复出现的组合起个名——这里一个β发夹，那里一个螺旋-转角-螺旋——这时你读的就是基序了，也就是折叠的构件。

在你继续往上爬之前，有一句诚实的提醒。知道一段链的二级结构，并不能告诉你整个蛋白质长什么样——那是下一级阶梯[[tertiary-structure|三级结构]]的活儿，在那里螺旋和折叠片会装配成一个单一的三维形状。而且，仅凭序列来预测二级结构虽然不错，却并不完美：同一段短肽，在一个蛋白质里可能摆成螺旋，在另一个蛋白质里却摆成链段，因为帮着拿主意的，是它在三维空间里的邻居，而不只是它自己那几个字母。像 AlphaFold 这样的工具已经把结构预测大大改进了，但折叠仍是一个我们在建模、而非彻底解决的问题。