核糖体并不是终点线
在这一级阶梯里,你已经看着一条新蛋白质离开核糖体、被分子伴侣接住,并折叠成能工作的形状。人们很容易以为故事到此为止:基因规定了氨基酸序列,链折叠好了,大功告成。但对你体内绝大多数蛋白质来说,折叠只是细胞收到一个毛坯零件的那一刻。接下来发生的,是装饰——细胞用化学方式给这条链贴标签、修剪、打扮,以掌控它去往何处、与什么结合、活性多高、能存活多久。这些事后的编辑,就是翻译后修饰(PTM),而蛋白质真正的工作生涯,正是从这里开始的。
为什么要费这个事?因为遗传密码只给核糖体二十种标准氨基酸可用——一套固定的字母表。PTM 偷偷带进了密码本身写不出的化学:这里加一个负电荷,那里挂一棵笨重的糖,那边再装一个油性的锚,让本来亲水的蛋白质也能抓住油性的膜。关键在于,许多标记是可逆的,于是细胞可以在几秒内把它们打开或关掉,而无需重新造一条蛋白质。所以一处修饰并不是在改错别字,而是一条信息——一种让造好的蛋白质*含义*随时刻而改变的办法。
磷酸化:细胞可逆的开关
最该弄懂的一种 PTM,就是[[protein-phosphorylation|磷酸化]]:把一个磷酸基团(PO4,取自 ATP)接到丝氨酸、苏氨酸或酪氨酸侧链上。磷酸虽小,却带着两个负电荷,所以往蛋白质上扔一个,就像在一个精密的合页上拍一块沉重的磁铁——它能把某个形状夹死、撬开另一个,或造出一块全新的黏性区域,让别的蛋白质能识别并停靠上去。一种叫激酶的酶负责加磷酸;一种叫磷酸酶的酶负责把它去掉。正因为两个方向都存在,磷酸化才是一个真正的开关,细胞能在几秒内来回拨动。
正是这种可逆性,使磷酸化处在细胞信号传导的核心。当胰岛素这样的激素到来,受体会给自己加上磷酸,这些新的磷酸标记就变成停靠位点,招募下一个蛋白质,后者又打开更多激酶——这就是一条激酶级联,像一队人传水桶那样,把一个微小的外部信号接力放大成一个庞大的内部反应。回想这架阶梯前面讲过的别构调节:磷酸往往是以别构方式起作用的,结合在一处,却改变蛋白质在远处的形状与活性。还是同一套分子逻辑,只是如今由一个细胞可随意添加或抹去的标记来驱动。
糖、泛素,以及那些小小的化学标记
[[protein-glycosylation|糖基化]]是把糖链——有时是十几个糖组成的分叉小树——接到蛋白质上,通常是在它沿着细胞的分泌路线穿行时进行的。你细胞表面上的大多数蛋白质、你分泌出去的大多数蛋白质(抗体、激素、黏液)都被大量糖基化;这些糖帮助它们折叠、保持稳定,并构成供别的细胞读取的识别标签。事实上,你的 ABO 血型,无非就是你的红细胞加上了哪种糖。这里有一个诚实而重要的要点:糖基化*并不*写在基因里。两个不同细胞造出的同一种蛋白质,可能带着不同的糖型,所以你没法简单地从 DNA 序列上把它的装饰读出来。
[[protein-ubiquitination|泛素化]]把一个叫泛素的小蛋白质接到赖氨酸侧链上。把好几个泛素以某种特定连接方式叠成一条链,你就写下了细胞经典的“销毁我”标签——通往蛋白酶体的地址,那台碎纸机你会在下一篇讲蛋白质回收的指南里见到。但别过度简化:泛素是一套*密码*,而不只是一纸死刑判决。连接方式和链长都很要紧——有些泛素标记把蛋白质改道送往新位置、更换它的搭档,或微调它的活性,根本不导致销毁。同一个标记,含义多端。
更小的标记补全了这套工具箱。甲基化加上一个微小的甲基(CH3);乙酰化加上一个乙酰基,中和掉一个正电荷。在大多数蛋白质上,这些只是微妙地调节活性,但在包装你 DNA 的组蛋白上,它们却成了一门著名的调控语言——也就是你在基因组那一级见过的组蛋白密码,其中的甲基和乙酰标记帮助决定一个基因是开还是关。脂化接上一条油性的脂肪链,给本来亲水的蛋白质装一个油腻的锚,让它能插进一张本来绝不可能触及的膜里。每一种标记都补上了二十种氨基酸根本无法提供的化学。
把无活性的前体切成有活性的形式
并非每一处修饰都是在添加什么——其中最具决定性的一种,是干净利落的一刀。在[[proteolytic-processing|蛋白水解加工]]中,蛋白质起初被造成一条更长的、无活性的前体(名字里常带“pro-”或“-原”),只有当一种酶切断某个特定的肽键、去掉一段之后,它才变得有活性。这正是细胞安全存放危险工具的办法:胃蛋白酶起初是以无害的胃蛋白酶原被造出并储存的,只有胃里的酸才会触发那一刀,露出有活性的酶——于是造它的细胞绝不会被自家产物消化掉。
激素胰岛素把这其中的好几道编辑叠在一起,正好成了一次完整领略蛋白质“后半生”的绝佳旅程。跟着这条链,从核糖体走到能工作的激素,并留意:这一切,单凭基因里氨基酸的拼写是看不出来的——全都是翻译之后的手艺。
- 核糖体先造出一条长链,叫前胰岛素原——一个前体的前体。
- 它的前端是一段信号肽,这条疏水的引导段把链送进内质网,随后被剪掉,剩下胰岛素原。
- 在内质网里,二硫键形成,把链上相距很远的部分交联起来,把折叠锁定——这本身就是对半胱氨酸侧链的一种共价修饰。
- 随后特定的酶切掉中间的一段(C 肽),留下两条短链,靠那些二硫键连在一起——正是这最后一刀,造出了成熟的、有活性的胰岛素。
- 成熟的激素被储存并释放出去;被切下的 C 肽也一起释放,医生通过测量血中的 C 肽来判断身体究竟造了多少胰岛素。
请注意一处诚实的不对称。磷酸或乙酰标记可以被抹去;被切断的肽键却不能。没有哪种酶能把链重新粘回去,所以蛋白水解加工是一个单向的开关——按设计就是不可逆的。这正是细胞用它来做那些不想被撤销的承诺的原因,比如给一种消化酶上膛,或触发使血液凝固的级联反应。
一个基因,许多蛋白质——蛋白质组为何远超基因组
现在退一步,把后果加总起来。人类只有约 2 万个编码蛋白质的基因——比一株葡萄藤还少,这个事实在基因组被测序时震惊了所有人。那么,如此精巧的生物,怎么靠这么少的基因运转?PTM 是答案的很大一部分。前面你已经见过一个倍增器——可变剪接,一个基因的 RNA 被剪开再重接,产出好几条不同的链。PTM 又叠上第二个、更大的倍增器:那些链中的每一条,都能同时存在于许多种被装饰的状态里。
1 gene
-> (alternative splicing) -> a few different chains
-> (phosphorylation: on/off at site 1, site 2, ...)
-> (glycosylation: many sugar patterns)
-> (ubiquitin / methyl / acetyl / lipid tags)
==> dozens-to-thousands of distinct protein STATES
proteins outnumber genes by a large factor这正是生物学家所说的[[proteomics|蛋白质组]]:它不是基因清单,而是一个细胞此刻全部真实蛋白质分子那不断变动的群体,每一个都处在它特定的修饰状态中。同一种蛋白质,在分裂的细胞里可能被磷酸化,在静息的细胞里却是素净的;在肝脏里按一种方式糖基化,在肿瘤里又按另一种方式。基因组是一份固定的零件清单;蛋白质组则是由它搭建起来的、活生生的、不断变化的库存。数基因告诉你的是词汇量;而蛋白质组才是细胞此刻真正在说的句子——其中大半的语法,正是 PTM。
往上爬时,请带着这幅图景。在之后的蛋白质功能类别、信号传导和基因调控那几级里,你会不断遇到一些蛋白质,单看序列根本说不通它们的行为——直到你去问:它们正带着哪些标记。一条蛋白质不只是它的基因所拼写的那样;它还是细胞此后对它所做的一切。