在拥挤的细胞里折叠

那根必须变成机器的线

上一阶里，你看着核糖体读取遗传密码、把氨基酸一颗颗缝成一条链。但从那台机器里滑出来的，从任何能干活的意义上说都还不是一个蛋白质——它是一根软塌塌、松垮垮的线，一条毫无形状的多肽，差不多就像一堆没串起来的散珠那样没用。你在上一阶学到的关于蛋白质功能的一切——活性位点的口袋、结合区域、那个允许别构的会呼吸的折叠——全都先得仰仗这条链塌缩成某一个精确的三维形状。本篇讲的就是这场塌缩：在它诞生之后的几秒到几分钟里，一根线如何找到那唯一一个能让它干活的形状。

这里有件事应当让你惊讶。一个不大的蛋白质，比如说 150 个残基，可能的形状多到无法想象——每一个肽键都能转动，而这些选择会层层相乘。如果这条链必须一个一个去试，哪怕每秒翻动十亿个形状，这场搜索也要把宇宙的年龄翻上许多倍才搜得完。然而真实的蛋白质在几毫秒到几分钟内就折好了。它们显然不是在盲目地搜索。所以折叠之谜其实是两个问题：是什么告诉这条链该奔向哪个形状，又是什么阻止它在半路上迷失？

安芬森：答案就写在序列里

第一个问题有一个干净而漂亮的答案，它来自一个经典实验。上世纪六十年代，克里斯蒂安·安芬森取来一个小酶——核糖核酸酶，在试管里把它彻底解开——加进药剂打断每一个弱键，甚至切断了起稳定作用的二硫键，只留下一根变性的、毫无生气的线。然后他轻轻地把那些药剂洗去。这个蛋白质竟全凭自己重新折叠，回到了一模一样的活性形状——试管里没有核糖体、没有帮手、没有任何指令，只有这条链本身。这个结论，如今叫做安芬森原理，就是：单凭氨基酸序列，就已经包含了确定折叠结构所需的全部信息。

为什么序列里会藏着答案？因为折叠由你在化学那一阶见过的同一批力推动，只是如今同时发力。最强的是疏水效应：这条链泡在水里，于是那些油性的、厌水的侧链争相把自己埋进内部、躲开溶剂，而亲水的那些则留在表面——而哪些残基是油性的，完全由序列定死。随着链变得紧凑，氢键咔嗒咔嗒地扣进你早已熟悉的规整图案——α螺旋和β折叠片——再由其余一张弱非共价接触之网把整个结构锁得严丝合缝。简而言之，折叠后的形状，就是这条序列所能落入的能量最低的排布，是一道自由能谷的谷底。

漏斗：搜索为何并非无望

于是序列选定了目的地——可这条链怎样*抵达*那里，又不必经历那不可能完成的盲目搜索？现代图景用一个鲜活的形象回答了第二个问题：折叠漏斗。设想一片能量的地貌，地表上每一个点都是这条链的一种可能形状，而它的高度就是那个形状的能量。这片地貌不是一马平川、只在某处藏着一个海底捞针般的孔；它的形状像一个漏斗——边缘宽阔而高耸，未折叠的链在那里于无数松软的形状之间游荡，地势则稳稳地*向下、向内*倾斜，奔向底部那唯一的低点，也就是折叠好的天然态。

漏斗化解了那个不可能搜索的悖论。一条链无需靠运气找到谷底；它只需要*往下坡*滚，而几乎任何使其能量降低的随机晃动，都会把它往里推一推。关键在于：并不存在唯一正确的路线——一百万条链从一百万个不同的松软形状出发，全都可以沿同一个漏斗的不同坡面滚落，到达同一个谷底。这正是折叠之所以快的原因：能量地貌本身在引路，使每一步都偏向目标。半路上的一些小坑——链会停顿的半折叠态——确实存在，有时也会拖慢进程，但整体的倾斜始终指向归宿。

ENERGY
  high |\          /|   <- unfolded: many floppy shapes, high energy
       | \        / |
       |  \  /\  /  |   <- partly folded; small dimples can trap briefly
       |   \/  \/   |
   low |    \__/         <- native fold: one low-energy bottom
            (many paths down -> one destination)

折叠漏斗：宽口顶部无数个起始形状，全都向下滚落到底部那唯一的天然折叠——无需盲目搜索。

诚实的乱象：在拥挤的细胞里折叠

安芬森的试管干净、稀薄、又有耐心。细胞内部一样也不沾。它拥挤得不可思议——被蛋白质和其他分子塞得密密匝匝，一条刚做好的链从冒头的那一刻起就和邻居们摩肩接踵。更糟的是，这条链是从核糖体里缓缓出来的、一头先出，于是它那些饥渴的疏水片段早早地裸露、晃荡在外，而本该用来把它们包埋起来的其余链段甚至还没被造出来。在这般拥挤中，最大的危险并不是折不起来——而是一条做了一半的链上裸露的黏性区域，抓住了*另一条*链的黏性区域，把许多条链黏成一坨无用、往往还有毒的团块，称为聚集体。

所以细胞绝不把折叠交给运气。它雇了一队叫做分子伴侣的帮手蛋白质——而我们值得把它们到底做什么说清楚，因为流行的图景是错的。一个伴侣*并不*替链去折叠；它不把链按进它的形状里，也不携带任何关于那形状应是什么样的指令。答案仍然握在序列手里，分毫不差，正如安芬森所言。伴侣所做的，是为链争取时间与私密空间：它结合住那些裸露的黏性片段，把它们从与邻居灾难性的相遇中遮护起来，然后再松手，给链又一个安静的机会去自我折叠。许多伴侣同时也是热激蛋白，当发热或胁迫威胁到要让全细胞的折叠纷纷散开时，它们会被额外大量地制造出来。

一类精巧的伴侣，伴侣蛋白（细菌里的 GroEL），充当一间隔离室。第一步：一条折了一半、黏性区域裸露的链，飘进一个中空的桶状腔里。
第二步：一个盖子（靠消耗ATP驱动）啪地合拢，把这条链单独封在里面——彻底安全，再没有别的链可供它黏附。
第三步：在那个私密的小气泡里，这条链沿着自己的漏斗滚落、不受打扰地折叠几秒钟。
第四步：盖子打开。若链折好了，它便离开；若没有，它或许再来一轮。请注意这间隔离室从不做什么——它从不告诉链该取什么形状。它只是给出一个安静的房间。

当折叠失败——以及近年预测折叠的飞跃

正因为折叠是持续的、缓慢的、又拥挤的，错误折叠便是一种持续的危险——而当安全网失灵时，后果是严重的。有些蛋白质会滑进一种另类形状，露出平坦、黏性的表面，而这种错误折叠形状的一份份拷贝彼此叠摞，堆成又长又顽固的纤维，称为淀粉样。这些沉积物是蛋白质错误折叠疾病——如阿尔茨海默病和帕金森病——的标志。最离奇的莫过于朊病毒：一个错误折叠的蛋白质充当模板，碰一碰同种蛋白质的一份正常拷贝，便诱使它照样错误折叠，于是这个坏形状从一个分子传到下一个分子——一场仅凭形状传播、不牵涉任何基因的感染。细胞用伴侣来反击，设法重新折叠或拆开聚集体，还动用你将在本阶后面遇到的清除系统；错误折叠疾病在很大程度上，正是这套防御被压垮的结果。

如果序列当真握着答案，那么有一份诱人的奖赏已在空中悬了五十年：我们能否仅凭序列、用计算机*预测*出折叠后的形状，而完全不必碰那个蛋白质？数十年来，这个“蛋白质折叠问题”出了名地难——哪怕有了漏斗的观念，要算出 150 个残基会落到哪里，仍然把最好的方法都难倒。后来，约莫在 2020 年，一个叫做AlphaFold的深度学习系统实现了真正的飞跃。它不是一步一步地模拟物理，而是从生物学家早已用实验解出的庞大结构库、再加上每个蛋白质的序列在物种间如何变异的演化记录里，学到了把序列与形状联系起来的规律。对于为数众多的蛋白质，它如今预测出的折叠，准确度足以与实验相媲美——而且它已对数以亿计的序列做到了这一点，是给整个生物学的一份厚礼。