原始转录本并不是成品信息
在转录那一级,你看着 RNA 聚合酶读取一个基因、写出一份 RNA 副本。很容易以为活儿到此就完了——信息已经存在,送去翻译就是。在细菌里,这大致没错。但你在基础篇也学过原核与真核之分:真核细胞把 DNA 封在细胞核内,转录就在核内进行,与核外的核糖体被一道墙隔开。这道墙改变了一切。新鲜的 RNA 不能在它被制造之处就被直接读取——它必须先经过加工、检验,并获准离开。
于是真核基因最初的 RNA 产物被称为 前体 mRNA(pre-mRNA)——它是前体,而非成品。把它变成成熟、可直接读取的 mRNA,正是 [[pre-mrna-processing|RNA 加工]]要做的事,而它有三件大活儿:给前端加上一顶保护帽、在后端切割并接上一条长尾、剪去那些不该留在最终信息里的内部片段。三件都做完,这分子才是真正的信使。把前体 mRNA 想成刚从打印机里出来的草稿:字句都在,但在任何人据此行动之前,它还缺一张封面、一处末尾签名,以及编辑的删改。
5' 帽:给前端戴上的安全帽
最先发生的事——还没等聚合酶写出一百个字母——就是 RNA 的前端获得一顶 [[molbio-five-prime-cap|5' 帽]]。细胞把一个经过修饰的鸟嘌呤核苷酸扣到 5' 端上,靠一种不寻常的“反向”连接相接,随后再给它加上一个甲基。结果是分子前端多了一个小小的化学“旋钮”,它看上去就是不像普通的 RNA 末端。回想每条链都有一个 5' 端和一个 3' 端;这顶帽子专门拴在 5' 端上。
这个古怪的旋钮以两种方式立功。其一,它是盔甲。细胞里满是从末端啃食游离 RNA 的酶,一个裸露的 5' 端无异于敞开邀请;而这顶帽子是瓶口的软木塞,那些酶抓不住它,于是加帽的 RNA 寿命大大延长。其二,它是把手。当信息终于抵达细胞质,核糖体的装载装置会识别这顶帽子,借它找到信息的前端、并以正确的朝向把它穿入。一句话:帽子既保护 RNA,又帮核糖体找到起点。一段没有帽子的真核转录本,既脆弱,又难以翻译。
3' 端:一刀干净的切割与一条长长的多聚 A 尾
帽子守着前端的同时,后端也有自己的待遇,而它的开场就出人意料:聚合酶通常会越过信息真正的终点继续往前跑。真正的 3' 端并不在转录停下的地方——它由切割来确定。一支蛋白班组沿着 RNA 一路盯着一段信号序列(在人体中常是字母 AAUAAA),在它下游不远处,把 RNA 干净利落地切成两段。前面那段才是要紧的;切口之外拖着的尾巴则被丢弃、降解。
切口一旦形成,一种专门的酶——不是 RNA 聚合酶,也不用任何模板——就开始往这新出现的 3' 端上一个接一个地添加腺嘌呤核苷酸,长长地接一串。这就是 [[polyadenylation|多聚腺苷酸化]],其结果便是 多聚 A 尾(poly-A 尾):在后端缀上的一串大约 50 到 250 个 A,写成纯文本就是 ...AAAAAAA。请注意它并不由任何基因编码;DNA 里并没有写“在这里放 200 个 A”。这条尾巴是事后由一种只会重复一个字母的酶添上去的。
这条尾巴有什么用?和帽子一样,它既是盾,也是信号。它保护 3' 端免遭那些同样啃食末端的酶;结合在尾巴上的蛋白则帮助把信息运出细胞核、帮助核糖体启动,并且——关键的是——设定信息的寿命。尾巴会随时间被慢慢修短;一旦短到某个程度,整条 mRNA 就被标记销毁。所以多聚 A 尾就像仙女棒上的引线:长尾意味着一份能被反复翻译的长寿信息,而被缩短的尾巴则在为终点倒数。前端有帽、后端有尾——这份信息如今两侧都有了受保护、可被识别的末端。
剪接:剪去那些“插话”
现在来看最奇怪也最美的一步。你在基因组那一级见过它,叫外显子—内含子结构:真核基因并不是一段连续的信息。最终会进入成熟 mRNA 的那些部分,即**外显子(exon,可想成 *ex*pressed,被表达的),被另一些不会进入的片段所打断,那便是内含子(intron,可想成 *in*tervening,插在中间的)。前体 mRNA 是把外显子和内含子一并、原原本本转录下来的,所以原始转录本读起来,就像一句话中间被硬塞进了好几个毫不相干的整段。在信息能表达任何意义之前,那些插进来的内含子段落必须被剪掉,再把外显子片段天衣无缝地接起来。这道编辑工序就是 剪接**。
细胞如何精确到单个字母地知道某个内含子从哪儿开始、到哪儿结束?它读取 RNA 里的几处短标记。几乎每个内含子都以字母 GU 开头、以 AG 结尾,而在末端稍稍上游处坐着一个特殊的 A,叫做分支点——这些就是标出切口的剪接位点与分支点。把这些边界对得分毫不差极其要紧:哪怕把切口挪动一个核苷酸,下游每一个密码子都会在错误的阅读框里被读取,把蛋白质搅成一团乱码。执行这台手术的机器是 [[molbio-spliceosome|剪接体]],一个由小 RNA 与蛋白质组装而成的庞大复合体。它本身就部分由 RNA 构成——这是个伏笔,我们会在接下来的几篇里接住:原来 RNA 不仅能当信息,还能充当催化剂。
pre-mRNA: cap-[ exon1 ]--GU~intron~AG--[ exon2 ]--GU~intron~AG--[ exon3 ]-AAAA...
\___ cut out ___/ \___ cut out ___/
mature mRNA: cap-[ exon1 ][ exon2 ][ exon3 ]-AAAA... (exons joined; introns gone)就在这里,一句陈旧的教科书口号悄然作古。剪接并不一定每次都把*同一批*外显子粘在一起。细胞可以保留某些外显子、跳过另一些,从一个基因里产出好几种不同的 mRNA——进而产出好几种不同的蛋白质。这就是 [[molbio-alternative-splicing|可变剪接]],也正是“一个基因,一种蛋白质”这句话过时的诚实原因。它还在很大程度上解释了:为何人类只靠约两万个蛋白质编码基因,就能搭起一具复杂得惊人的身体——一个基因往往是一套可以用不止一种方式组装的“组件包”,而不是单一固定的成品。
同步进行:RNA 仍在书写之时便已加工
人们很自然会以为这三步是在转录结束后井然有序地依次发生:先把整条 RNA 写完,再加帽,再剪接,再加尾。这幅画面错得很有启发。绝大部分加工是共转录的——它在*聚合酶还在转录的同时*,就在已经露头的那段 RNA 上进行,甚至在整个基因被读完之前就开始了。
- 加帽最先发生,几乎是立刻:新的 5' 端一从聚合酶里探出来——还在头几十个核苷酸之内——搭乘在聚合酶上的加帽酶就把帽子扣了上去。
- 剪接边走边做:每当一个内含子被完整转录、垂挂在移动着的聚合酶身后时,剪接体就能在它身上组装并把它切除,远早于下游的外显子被造出来。
- 切割与加尾收尾后端:当聚合酶终于转录到接近末端的 AAUAAA 信号时,那支同样一路搭车的切割班组把 RNA 切开,多聚 A 酶接上尾巴——而这一刀也帮着触发转录终止。
把这一切串起来的,是聚合酶自己的“尾巴”——一条长而柔软的蛋白质“手臂”,从 RNA 聚合酶的背后拖出来,充当一张移动的工作台。加帽酶、剪接组件和切割班组全都停靠在这条手臂上,被一同带在初露的 RNA 旁边,于是转录本的每一段一旦就绪,它的编辑班组早已守候在侧。加工不是事后才上的流水线;它就织进了转录本身。这种偶联也是一道保险:一条没能正确加帽、剪接、加尾的转录本,通常会被扣住销毁、而非被输出——这恰恰说明了,为什么细胞核才是让这一切发生的恰当场所。