起始、延伸与终止

同样的三幕形状，这次由核糖体来跑

到现在，这套阵容你已经熟了。你知道遗传密码一次读三个字母，知道一个 tRNA 是给每个密码子运来正确氨基酸的适配器，也知道核糖体是负责阅读的那台两部件机器。这一篇不再点名演员，而是看着他们干活——它跟随一个核糖体走完一次完整的造蛋白过程，从它认定一段信息的那一刻，到它把造好的链放走的那一刻。整场演出分成你在转录里见过的同样三幕：起始（在起点组装）、延伸（平稳的中段）、和终止（知道何时停下）。

这个形状与转录押韵，但部件和利害关系都不同。在那里，机器读 DNA、写 RNA；在这里，核糖体读 RNA、写一条氨基酸链，整套字母表都换了——进去的是核苷酸，出来的是一条多肽。而它的节奏系于那三个字母的拍子：每个密码子都必须被依次配对、成键、走过。整篇我会借用一个画面——一条流水线，每个工位读取一条三字母的指令、扣上一颗珠子，再把传送带恰好往前棘进一条指令。

第一幕——起始：在正确的起跑线上组装

起始要解决整个过程里最难的问题：到底从哪里开始。这比听起来要紧得多，因为信息是按不重叠的三联体来读的，所以起点的选择就把之后一切的阅读框给定死了。选错了 AUG，或者起头错开一个字母，下游每一个密码子都会被错误地分组——蛋白质出来就是一堆乱码。所以核糖体不能随手抓起信息就走；它必须找到真正的起始密码子，即开启真正编码序列的那个 AUG，并精确地锁定它。

细菌与真核生物寻找那个 AUG 的方式截然不同，这也是看两大域如何分道扬镳的最干净处。在细菌里，信息在起点上游几个碱基处带着一条短短的着陆带，即 [[shine-dalgarno-sequence|夏因-达尔加诺序列]]。它与小亚基自身 rRNA 的尾端互补，于是两者直接碱基配对——核糖体的小亚基像钥匙插进贴了标签的槽位那样咔哒扣上信息，把起始密码子正好停在它该在的位置。正因为碱基直接配对，细菌核糖体能在一段带有这个信号的信息上任意处停靠，这就是为什么一条细菌 mRNA 可以携带数个各自独立翻译的基因。

真核生物没有夏因-达尔加诺信号，于是改用扫描帽子的办法。小亚基载着起始因子和特殊的起始 tRNA-Met，扣住 mRNA 最前端的 5′ 帽子（就是我们加工前体 mRNA 时见过的那个帽子），然后沿下游*扫描*，一个字母一个字母地滑过去，直到抵达第一个处在合适语境中的 AUG。想象一位读者，他必须永远从第一页开始、向前略读以找到章节标题，而不能直接翻到书签。无论哪种方式，这一幕的收尾都一样：起始 tRNA 落进核糖体的 P 位、与起始密码子配对，大亚基随后合上，组装好的核糖体就绪——第一个氨基酸已就位，A 位空着，等着。

第二幕——延伸：读、成键、移位、重复

现在平稳的中段开始了。延伸是一个每个密码子重复一次的循环，看清它的关键在于核糖体的三个 tRNA 槽位，名叫 A、P、E。把它们想成三把相邻的椅子：A 位（到达，Arrival）是新来的 tRNA 递交氨基酸的地方，P 位（肽，Peptide）握着携带迄今造好的链的那个 tRNA，E 位（离开，Exit）则是用过的 tRNA 退场的门口。整个循环不过是 tRNA 依次穿过这三把椅子的有序队列，一次走一个密码子。

到达并核对：一个延伸因子（细菌里的 EF-Tu）把下一个 tRNA 领进空着的 A 位。它的反密码子对着 A 位的密码子试配；只有正确的三字母匹配才让因子花掉它的 GTP、把 tRNA 锁住。错误的 tRNA 还来不及定下就掉出去——这一校对步骤是翻译之所以准确的主要原因。
成键：此刻两个氨基酸并排站好（增长中的链在 P 位、新来的那个在 A 位），核糖体自身的催化核心、即 [[peptidyl-transferase|肽酰转移酶]]中心，用一个肽键把它们连起来——把整条链转移到 A 位的氨基酸上。引人注目的是，这个催化剂是由 rRNA、而非蛋白质构成的：核糖体是一种核酶。
移位：第二个延伸因子（EF-G）花掉又一个 GTP，推动移位——核糖体恰好往前棘进一个密码子。刚交出链的那个 tRNA 从 A 滑到 P，此刻已空的 tRNA 从 P 滑到 E 并被弹出，一个新鲜的密码子滚进空出来的 A 位。循环就绪，可以重复。

        E site        P site        A site
      [ exit ]      [ chain ]     [ arrival ]
         |              |              |
  5'...  C C C   A U G   G C A   U U U  ...3'   mRNA
                  (Met)  (Ala)  (Phe-tRNA arriving)

  read 3 letters -> bond chain onto A-site aa -> shift one codon ->
      P-tRNA slides to E (ejected), A-tRNA slides to P, new codon enters A

  growing peptide:  H2N-Met-Ala- ... -[next residue added at A site]

核糖体 A、P、E 三个位点上的一个延伸循环：一个配对正确的 tRNA 到达，链被接到它上面，然后核糖体恰好移位一个密码子，用过的 tRNA 退出。

几个诚实的细节，让这不至于沦为童话。链总是从它的氨基端朝羧基端增长，信息总是按 5′ 到 3′ 读取，所以合成只沿一个固定的方向进行。它很快——细菌核糖体大约每秒添加 15 到 20 个氨基酸——也很准，因为有那个 A 位核对步骤，误掺入率大约只有每一万个氨基酸出一次错。而且核糖体很少单干：通常许多核糖体会同时上到一条 mRNA 上，首尾相接地跟着、像单行道上的一串车，于是一段信息被并行翻译成许多份蛋白质副本。这支车队就叫做[[polysome|多核糖体]]。

第三幕——终止：一个没有 tRNA 的终止密码子

如果没有东西叫它停，这循环会永远转下去——所以信息以三个终止密码子之一（UAA、UAG 或 UGA）作结。这里有个优雅的花招：这些密码子没有对应的 tRNA。正常的适配器库里没有任何东西能读它们，所以当一个终止密码子滚进 A 位时，没有 tRNA 到来，流水线带着一把空椅子停住。这个空缺，就是信号。一个[[translation-termination-release-factor|释放因子]]踏进那个空着的 A 位——它是一个蛋白、不是 tRNA，其形状能直接识别终止密码子，并嵌进本该由 tRNA 占的位置。

释放因子一旦就位，它就用那个曾经造出每一个肽键的同一个催化中心，做了一件巧妙的事。它不让链被转移到另一个氨基酸上，而是让一个水分子去攻击那个把造好的蛋白质系在最后一个 tRNA 上的键。这次水解把链剪断——完工的多肽飘走，去折叠、去履行它的职责。随后其余演员各自拆散：在一个回收因子（以及又一个用掉的 GTP）的帮助下，两个核糖体亚基分开，最后一个 tRNA 和那条 mRNA 被释放，各个部件便自由地去寻找一段新的信息，把整场演出从头再来一遍。

退一步——整个过程的形状

留意这三幕与你在转录里见过的对应得多么干净，也留意核糖体的准确度与聚合酶的是怎样以不同方式建立起来的。转录靠倒退、剪掉一个它已经加上去的错碱基来校对；翻译则把大部分核对放在*下注之前*——一个错误的 tRNA 在 A 位、在任何肽键被锻造之前，就被拒之门外。也留意能量花在哪里：几乎每一个要紧的步骤（装载一个 tRNA、移位、回收）都用 GTP 来支付，这就是为什么造蛋白质是细胞最耗能的事情之一。这台机器不是免费运转的；它是被买下来的，一次一个密码子。

在你继续向上攀登之前，有两点诚实的提醒。其一，“从核糖体里出来的链就是一条完工、能干活的蛋白质”这句话是个有用的简化，而非真相：一条刚出炉的多肽是一根软塌塌的线，它还得先折叠、还常常要被修饰，才能工作——而这正是本阶梯下一级要接着讲的地方。其二，要抵住“一个基因就是一个蛋白质”这种利落的虚构。同一段编码信息可以被读成不止一种产物（通过上游的可变剪接，以及起始密码子的选择），而那条链此后还可以被切割、装饰、编辑。你现在掌握的三幕故事，讲的是*一条*蛋白质是怎么造出来的；它是基因表达的脊梁，但它周围的躯体，要比一条笔直的线丰富得多。