那根必须变成机器的线
上一阶里,你看着核糖体读取遗传密码、把氨基酸一颗颗缝成一条链。但从那台机器里滑出来的,从任何能干活的意义上说都还不是一个蛋白质——它是一根软塌塌、松垮垮的线,一条毫无形状的多肽,差不多就像一堆没串起来的散珠那样没用。你在上一阶学到的关于蛋白质功能的一切——活性位点的口袋、结合区域、那个允许别构的会呼吸的折叠——全都先得仰仗这条链塌缩成某一个精确的三维形状。本篇讲的就是这场塌缩:在它诞生之后的几秒到几分钟里,一根线如何找到那唯一一个能让它干活的形状。
这里有件事应当让你惊讶。一个不大的蛋白质,比如说 150 个残基,可能的形状多到无法想象——每一个肽键都能转动,而这些选择会层层相乘。如果这条链必须一个一个去试,哪怕每秒翻动十亿个形状,这场搜索也要把宇宙的年龄翻上许多倍才搜得完。然而真实的蛋白质在几毫秒到几分钟内就折好了。它们显然不是在盲目地搜索。所以折叠之谜其实是两个问题:是什么告诉这条链该奔向哪个形状,又是什么阻止它在半路上迷失?
安芬森:答案就写在序列里
第一个问题有一个干净而漂亮的答案,它来自一个经典实验。上世纪六十年代,克里斯蒂安·安芬森取来一个小酶——核糖核酸酶,在试管里把它彻底解开——加进药剂打断每一个弱键,甚至切断了起稳定作用的二硫键,只留下一根变性的、毫无生气的线。然后他轻轻地把那些药剂洗去。这个蛋白质竟全凭自己重新折叠,回到了一模一样的活性形状——试管里没有核糖体、没有帮手、没有任何指令,只有这条链本身。这个结论,如今叫做安芬森原理,就是:单凭氨基酸序列,就已经包含了确定折叠结构所需的全部信息。
为什么序列里会藏着答案?因为折叠由你在化学那一阶见过的同一批力推动,只是如今同时发力。最强的是疏水效应:这条链泡在水里,于是那些油性的、厌水的侧链争相把自己埋进内部、躲开溶剂,而亲水的那些则留在表面——而哪些残基是油性的,完全由序列定死。随着链变得紧凑,氢键咔嗒咔嗒地扣进你早已熟悉的规整图案——α螺旋和β折叠片——再由其余一张弱非共价接触之网把整个结构锁得严丝合缝。简而言之,折叠后的形状,就是这条序列所能落入的能量最低的排布,是一道自由能谷的谷底。
漏斗:搜索为何并非无望
于是序列选定了目的地——可这条链怎样*抵达*那里,又不必经历那不可能完成的盲目搜索?现代图景用一个鲜活的形象回答了第二个问题:折叠漏斗。设想一片能量的地貌,地表上每一个点都是这条链的一种可能形状,而它的高度就是那个形状的能量。这片地貌不是一马平川、只在某处藏着一个海底捞针般的孔;它的形状像一个漏斗——边缘宽阔而高耸,未折叠的链在那里于无数松软的形状之间游荡,地势则稳稳地*向下、向内*倾斜,奔向底部那唯一的低点,也就是折叠好的天然态。
漏斗化解了那个不可能搜索的悖论。一条链无需靠运气找到谷底;它只需要*往下坡*滚,而几乎任何使其能量降低的随机晃动,都会把它往里推一推。关键在于:并不存在唯一正确的路线——一百万条链从一百万个不同的松软形状出发,全都可以沿同一个漏斗的不同坡面滚落,到达同一个谷底。这正是折叠之所以快的原因:能量地貌本身在引路,使每一步都偏向目标。半路上的一些小坑——链会停顿的半折叠态——确实存在,有时也会拖慢进程,但整体的倾斜始终指向归宿。
ENERGY
high |\ /| <- unfolded: many floppy shapes, high energy
| \ / |
| \ /\ / | <- partly folded; small dimples can trap briefly
| \/ \/ |
low | \__/ <- native fold: one low-energy bottom
(many paths down -> one destination)诚实的乱象:在拥挤的细胞里折叠
安芬森的试管干净、稀薄、又有耐心。细胞内部一样也不沾。它拥挤得不可思议——被蛋白质和其他分子塞得密密匝匝,一条刚做好的链从冒头的那一刻起就和邻居们摩肩接踵。更糟的是,这条链是从核糖体里缓缓出来的、一头先出,于是它那些饥渴的疏水片段早早地裸露、晃荡在外,而本该用来把它们包埋起来的其余链段甚至还没被造出来。在这般拥挤中,最大的危险并不是折不起来——而是一条做了一半的链上裸露的黏性区域,抓住了*另一条*链的黏性区域,把许多条链黏成一坨无用、往往还有毒的团块,称为聚集体。
所以细胞绝不把折叠交给运气。它雇了一队叫做分子伴侣的帮手蛋白质——而我们值得把它们到底做什么说清楚,因为流行的图景是错的。一个伴侣*并不*替链去折叠;它不把链按进它的形状里,也不携带任何关于那形状应是什么样的指令。答案仍然握在序列手里,分毫不差,正如安芬森所言。伴侣所做的,是为链争取时间与私密空间:它结合住那些裸露的黏性片段,把它们从与邻居灾难性的相遇中遮护起来,然后再松手,给链又一个安静的机会去自我折叠。许多伴侣同时也是热激蛋白,当发热或胁迫威胁到要让全细胞的折叠纷纷散开时,它们会被额外大量地制造出来。
当折叠失败——以及近年预测折叠的飞跃
正因为折叠是持续的、缓慢的、又拥挤的,错误折叠便是一种持续的危险——而当安全网失灵时,后果是严重的。有些蛋白质会滑进一种另类形状,露出平坦、黏性的表面,而这种错误折叠形状的一份份拷贝彼此叠摞,堆成又长又顽固的纤维,称为淀粉样。这些沉积物是蛋白质错误折叠疾病——如阿尔茨海默病和帕金森病——的标志。最离奇的莫过于朊病毒:一个错误折叠的蛋白质充当模板,碰一碰同种蛋白质的一份正常拷贝,便诱使它照样错误折叠,于是这个坏形状从一个分子传到下一个分子——一场仅凭形状传播、不牵涉任何基因的感染。细胞用伴侣来反击,设法重新折叠或拆开聚集体,还动用你将在本阶后面遇到的清除系统;错误折叠疾病在很大程度上,正是这套防御被压垮的结果。
如果序列当真握着答案,那么有一份诱人的奖赏已在空中悬了五十年:我们能否仅凭序列、用计算机*预测*出折叠后的形状,而完全不必碰那个蛋白质?数十年来,这个“蛋白质折叠问题”出了名地难——哪怕有了漏斗的观念,要算出 150 个残基会落到哪里,仍然把最好的方法都难倒。后来,约莫在 2020 年,一个叫做AlphaFold的深度学习系统实现了真正的飞跃。它不是一步一步地模拟物理,而是从生物学家早已用实验解出的庞大结构库、再加上每个蛋白质的序列在物种间如何变异的演化记录里,学到了把序列与形状联系起来的规律。对于为数众多的蛋白质,它如今预测出的折叠,准确度足以与实验相媲美——而且它已对数以亿计的序列做到了这一点,是给整个生物学的一份厚礼。