从局部的针脚到一整个形状
在上一篇指南里,你学会了把一条链读作一幅由螺旋和折叠片组成的布局图——也就是它的[[secondary-structure|二级结构]],那些局部的针脚。可是,认得了针脚,并不能告诉你成衣是什么形状。一个带着三段螺旋和一张四链折叠片的蛋白质,原则上可以把这些部件排出无数种样子。[[tertiary-structure|三级结构]]回答的正是下一个问题:*整条*链——螺旋、折叠片,以及它们之间的环——究竟如何装配成一个特定、紧凑的三维形状?正是在这一层,一根软线终于变成了一个有里有外、轮廓分明的物体。
这里有一个相对于上一层的关键转变。二级结构是靠主链骨架维系的——也就是每个氨基酸都共有的、重复出现的 N-H 和 C=O 基团。而三级结构,主要是靠[[amino-acid-side-chain|侧链]]维系的,也就是那些一个氨基酸与下一个氨基酸各不相同的部分。针脚是由主链拼出来的;而整件衣服的形状,则取决于序列恰好带着哪些侧链,以及当链坍缩之后它们最终彼此触碰在哪里。还是同一条链,但如今登台主导的,是一批全新的角色。
驱动力:把油腻的部分藏起来,躲开水
这根链究竟为什么会坍缩成一团,而不是松松垮垮地乱晃呢?主要的答案,是你早在化学那一级就遇到过的一个观念:[[molbio-hydrophobic-effect|疏水效应]]。二十种侧链里大约有一半是油性的——它们没法和水形成氢键,于是被水推开。回想一下那个类比:一杯水里的油滴,其实并不真的互相吸引;而是水把它们挤到一块儿,好让自己那张整齐的氢键网络得以保全。同样的事情,也发生在一条蛋白质链的内部。包围着蛋白质的水,把所有油腻的侧链全都挤到一起,挤进中心,赶得远离它自己。
结果,就是几乎每一个折叠好的、可溶于水的蛋白质最重要的那一个特征:一个疏水核心。油性的侧链最终被埋在里面,彼此紧紧地、干燥地挨挤在一处;而亲水的侧链则铺展在表面,怡然地朝着四周的水。把蛋白质想象成一颗夹心糖:油腻的芯,裹着一层糖衣——只不过,细胞造它的办法,是干脆放手让水来做这道分拣。把核心埋起来,并不是给一个已经折好的蛋白质做做收尾的小动作;它本身就是从一开始就拉着整场坍缩向前推进的主引擎。
把它锁定:化学键与桥
疏水效应提供了大部分力气,但一旦链坍缩之后,还有几种更精细的相互作用会把这个形状收紧、锁定。当一个带正电的侧链紧挨着一个带负电的侧链、像两块磁铁那样互相吸引时,就形成了一座[[molbio-ionic-interaction|盐桥]]——这是一个小而精准的夹子,帮着把一处折叠的边缘扣在一起。侧链之间的氢键,以及核心里那些紧密堆叠的原子之间又弱又近的[[molbio-van-der-waals-forces|范德华]]接触,会在整个结构上累加起来。它们单个都算不上强;而它们的威力,跟蛋白质的一贯作风一样,来自齐心协力地一起作用。
对于这条又温和又可断的规律,有一个例外,值得记住:[[disulfide-bond|二硫键]]。当两个半胱氨酸的侧链——每个末端都带着一个活泼的 -SH 基团——靠近时,它们可以反应、形成一根真正的共价 S-S 连接,是一枚货真价实的化学订书钉,而不是一份微弱的吸引。一根二硫键把链上相距遥远的两个部分牢牢钉在一起,就像一颗铆钉穿透一个折好的形状。这些订书钉在细胞内部很少见(细胞内部化学上是还原性的,会把它们拆掉),但在那些必须在细胞外严酷世界里存活的蛋白质里却很常见——抗体、胰岛素、你头发里的角蛋白。哪里需要额外的坚韧,细胞就在哪里加上铆钉。
what holds tertiary structure together (whole-chain shape) hydrophobic core greasy side chains buried, dry, packed <- MAIN driver salt bridge (+) side chain ...attracts... (-) side chain H-bond side-chain donor ... side-chain acceptor van der Waals atoms packed snugly in the dry core disulfide bond Cys-SH + HS-Cys --> Cys-S-S-Cys (covalent staple) weak + many + cooperative = one stable, specific fold
结构域:能独立工作的一团折叠
小的蛋白质会折叠成单独一团紧凑的疙瘩。但许多蛋白质很大,而大链很少作为一个巨大的整体一次折好。它们往往是分段折叠的:一条长链沿着自己的长度,形成两团、三团乃至更多紧凑的疙瘩,每一团或多或少都是独立折叠的。每一个这样半独立的单元,就是一个[[protein-domain|结构域]]——通常是一百来个残基,坍缩成它自己的一个小小的疏水核心、它自己稳定的形状,常常即便你把它从链上剪下来,它也照样能折好。从某种意义上说,一个结构域,就是蛋白质里的一个蛋白质。
结构域之所以重要,是因为它们也是*功能*的单元,而不只是折叠的单元。一个结构域也许是负责结合 DNA 的那部分,另一个是负责抓住信号分子的那部分,第三个是负责把蛋白质锚定在膜上的那部分——三种活儿,三个模块,一条链。演化对此毫不客气地加以利用:正因为一个结构域能自己折叠、自己干活,它就可以被复制、被洗牌、被粘贴进新的链里,用经过验证的零件去搭出新的蛋白质——这个想法叫外显子混编,你在演化那一级还会再遇到它。把结构域想象成功能上一块块标准化的乐高积木:细胞把它们排列组合,去拼出自己庞大的工具箱,而不必把每件工具都从头重新发明一遍。
四级结构:多条链,一台机器
到目前为止,每一个层次说的都是单独一条链。但许多蛋白质,要等到*好几条*已经完全折好的链聚到一起、彼此抓牢、扣成一个更大的复合体,才算大功告成。这种装配,就是[[quaternary-structure|四级结构]],而其中每一条单独折好的链,叫做一个亚基。当初折好一条链的那些温和的力——埋起来的疏水斑块、盐桥、氢键——如今也在链*与链之间*发挥作用,沿着彼此匹配的表面把亚基粘在一起。由两个亚基组成的蛋白质叫二聚体;四个的,叫四聚体。有些是同一条链的拷贝;有些则把不同的链混搭进同一个工作单元。
何必费事去装配好几条链,而不干脆造一条大的呢?因为把亚基拼到一起,能解锁单独一条链做不到的把戏。经典的例子就是血红蛋白,你血液里的运氧工:四个亚基紧紧相扣,当其中一个亚基抓住一个氧分子时,它会推搡其余几个,让它们变成一种更急切地去抓氧的形状。亚基之间的这种协作——在肺里贪婪地把氧捡起来,在组织里又爽快地把氧卸下去——是单独一条链独自作业所办不到的。多亚基装配,是细胞最爱用来打造开关和放大器的手段之一;这个协作的把戏究竟是怎么运作的,你会在下一篇讲酶与别构的指南里看个明白。
安芬森:折叠写在序列里
退一步,问那个最深的问题:究竟是什么决定了这整个最终的形状——二级、三级、四级,所有这一切?在 1960 年代,克里斯蒂安·安芬森用一个漂亮而简单的实验回答了它。他取了一个小酶——核糖核酸酶——在试管里把它彻底解开,打断它的二硫键,把它的形状统统洗掉,直到它成了一根软塌塌、毫无用处的线。然后,他轻轻地把那些用来解折叠的化学药剂去掉。无人帮忙、只剩盐和水,那条链竟然自己重新折叠,折回了它原本一模一样的形状,活性恢复了,连二硫键都在正确的位置上重新接好了。
结论就是[[anfinsen-principle|安芬森原理]]:折叠一个蛋白质所需的全部信息,已经包含在它的氨基酸序列之中了。不需要外来的模板,不需要模具,除了链本身之外不需要任何额外的指令——是一级结构决定了折叠。这就合上了你在本级一开头打开的那个环:珠子的排列顺序,确实就是全部的讯息,因为正是这个顺序,经由侧链以及它们周围那个水的世界来解读,决定了最终那台机器。它也径直连回了你早先学过的那条核心流动:DNA 的序列设定了蛋白质的序列,而蛋白质的序列设定了它的形状。
不过,对两个重要的局限要诚实以待。第一,“序列决定折叠”并不意味着折叠很容易,也不意味着细胞总能不靠外援自己搞定。安芬森那个小小的酶,是在一支安静的试管里干净利落地重新折好的;可是在拥挤、塞得满满当当的细胞内部,许多蛋白质需要帮手机器——分子伴侣——才能折好,而不至于结成一团没用的乱麻。信息在序列里;但要可靠地折到那个形状,往往需要帮忙,这个故事,折叠那一级会完整讲述。第二,反过来的难题——用计算机从序列去*预测*折叠——曾是一道折磨了五十年的头疼事。像[[alphafold-structure-prediction|AlphaFold]]这样的工具已经把它大大改进了,是一次非凡的飞跃,但结构预测仍是一门在建模、在改进的手艺,而不是一条已被彻底解决的定律。