JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

起始、延伸与终止

看着核糖体从头到尾造出一条蛋白质:先在起始密码子上组装好,再锁进一种“读—成键—移位”、三个字母走一拍的节奏,直到一个终止密码子终于叫它松手。一台机器,三个阶段,一条造好的链。

同样的三幕形状,这次由核糖体来跑

到现在,这套阵容你已经熟了。你知道遗传密码一次读三个字母,知道一个 tRNA 是给每个密码子运来正确氨基酸的适配器,也知道核糖体是负责阅读的那台两部件机器。这一篇不再点名演员,而是看着他们干活——它跟随一个核糖体走完一次完整的造蛋白过程,从它认定一段信息的那一刻,到它把造好的链放走的那一刻。整场演出分成你在转录里见过的同样三幕:起始(在起点组装)、延伸(平稳的中段)、和终止(知道何时停下)。

这个形状与转录押韵,但部件和利害关系都不同。在那里,机器读 DNA、写 RNA;在这里,核糖体读 RNA、写一条氨基酸链,整套字母表都换了——进去的是核苷酸,出来的是一条多肽。而它的节奏系于那三个字母的拍子:每个密码子都必须被依次配对、成键、走过。整篇我会借用一个画面——一条流水线,每个工位读取一条三字母的指令、扣上一颗珠子,再把传送带恰好往前棘进一条指令。

第一幕——起始:在正确的起跑线上组装

起始要解决整个过程里最难的问题:到底从哪里开始。这比听起来要紧得多,因为信息是按不重叠的三联体来读的,所以起点的选择就把之后一切的阅读框给定死了。选错了 AUG,或者起头错开一个字母,下游每一个密码子都会被错误地分组——蛋白质出来就是一堆乱码。所以核糖体不能随手抓起信息就走;它必须找到真正的起始密码子,即开启真正编码序列的那个 AUG,并精确地锁定它。

细菌与真核生物寻找那个 AUG 的方式截然不同,这也是看两大域如何分道扬镳的最干净处。在细菌里,信息在起点上游几个碱基处带着一条短短的着陆带,即 [[shine-dalgarno-sequence|夏因-达尔加诺序列]]。它与小亚基自身 rRNA 的尾端互补,于是两者直接碱基配对——核糖体的小亚基像钥匙插进贴了标签的槽位那样咔哒扣上信息,把起始密码子正好停在它该在的位置。正因为碱基直接配对,细菌核糖体能在一段带有这个信号的信息上任意处停靠,这就是为什么一条细菌 mRNA 可以携带数个各自独立翻译的基因。

真核生物没有夏因-达尔加诺信号,于是改用扫描帽子的办法。小亚基载着起始因子和特殊的起始 tRNA-Met,扣住 mRNA 最前端的 5′ 帽子(就是我们加工前体 mRNA 时见过的那个帽子),然后沿下游*扫描*,一个字母一个字母地滑过去,直到抵达第一个处在合适语境中的 AUG。想象一位读者,他必须永远从第一页开始、向前略读以找到章节标题,而不能直接翻到书签。无论哪种方式,这一幕的收尾都一样:起始 tRNA 落进核糖体的 P 位、与起始密码子配对,大亚基随后合上,组装好的核糖体就绪——第一个氨基酸已就位,A 位空着,等着。

第二幕——延伸:读、成键、移位、重复

现在平稳的中段开始了。延伸是一个每个密码子重复一次的循环,看清它的关键在于核糖体的三个 tRNA 槽位,名叫 A、P、E。把它们想成三把相邻的椅子:A 位(到达,Arrival)是新来的 tRNA 递交氨基酸的地方,P 位(肽,Peptide)握着携带迄今造好的链的那个 tRNA,E 位(离开,Exit)则是用过的 tRNA 退场的门口。整个循环不过是 tRNA 依次穿过这三把椅子的有序队列,一次走一个密码子。

  1. 到达并核对:一个延伸因子(细菌里的 EF-Tu)把下一个 tRNA 领进空着的 A 位。它的反密码子对着 A 位的密码子试配;只有正确的三字母匹配才让因子花掉它的 GTP、把 tRNA 锁住。错误的 tRNA 还来不及定下就掉出去——这一校对步骤是翻译之所以准确的主要原因。
  2. 成键:此刻两个氨基酸并排站好(增长中的链在 P 位、新来的那个在 A 位),核糖体自身的催化核心、即 [[peptidyl-transferase|肽酰转移酶]]中心,用一个肽键把它们连起来——把整条链转移到 A 位的氨基酸上。引人注目的是,这个催化剂是由 rRNA、而非蛋白质构成的:核糖体是一种核酶。
  3. 移位:第二个延伸因子(EF-G)花掉又一个 GTP,推动移位——核糖体恰好往前棘进一个密码子。刚交出链的那个 tRNA 从 A 滑到 P,此刻已空的 tRNA 从 P 滑到 E 并被弹出,一个新鲜的密码子滚进空出来的 A 位。循环就绪,可以重复。
        E site        P site        A site
      [ exit ]      [ chain ]     [ arrival ]
         |              |              |
  5'...  C C C   A U G   G C A   U U U  ...3'   mRNA
                  (Met)  (Ala)  (Phe-tRNA arriving)

  read 3 letters -> bond chain onto A-site aa -> shift one codon ->
      P-tRNA slides to E (ejected), A-tRNA slides to P, new codon enters A

  growing peptide:  H2N-Met-Ala- ... -[next residue added at A site]
核糖体 A、P、E 三个位点上的一个延伸循环:一个配对正确的 tRNA 到达,链被接到它上面,然后核糖体恰好移位一个密码子,用过的 tRNA 退出。

几个诚实的细节,让这不至于沦为童话。链总是从它的氨基端朝羧基端增长,信息总是按 5′ 到 3′ 读取,所以合成只沿一个固定的方向进行。它很快——细菌核糖体大约每秒添加 15 到 20 个氨基酸——也很准,因为有那个 A 位核对步骤,误掺入率大约只有每一万个氨基酸出一次错。而且核糖体很少单干:通常许多核糖体会同时上到一条 mRNA 上,首尾相接地跟着、像单行道上的一串车,于是一段信息被并行翻译成许多份蛋白质副本。这支车队就叫做[[polysome|多核糖体]]

第三幕——终止:一个没有 tRNA 的终止密码子

如果没有东西叫它停,这循环会永远转下去——所以信息以三个终止密码子之一(UAA、UAG 或 UGA)作结。这里有个优雅的花招:这些密码子没有对应的 tRNA。正常的适配器库里没有任何东西能读它们,所以当一个终止密码子滚进 A 位时,没有 tRNA 到来,流水线带着一把空椅子停住。这个空缺,就是信号。一个[[translation-termination-release-factor|释放因子]]踏进那个空着的 A 位——它是一个蛋白、不是 tRNA,其形状能直接识别终止密码子,并嵌进本该由 tRNA 占的位置。

释放因子一旦就位,它就用那个曾经造出每一个肽键的同一个催化中心,做了一件巧妙的事。它不让链被转移到另一个氨基酸上,而是让一个水分子去攻击那个把造好的蛋白质系在最后一个 tRNA 上的键。这次水解把链剪断——完工的多肽飘走,去折叠、去履行它的职责。随后其余演员各自拆散:在一个回收因子(以及又一个用掉的 GTP)的帮助下,两个核糖体亚基分开,最后一个 tRNA 和那条 mRNA 被释放,各个部件便自由地去寻找一段新的信息,把整场演出从头再来一遍。

退一步——整个过程的形状

留意这三幕与你在转录里见过的对应得多么干净,也留意核糖体的准确度与聚合酶的是怎样以不同方式建立起来的。转录靠倒退、剪掉一个它已经加上去的错碱基来校对;翻译则把大部分核对放在*下注之前*——一个错误的 tRNA 在 A 位、在任何肽键被锻造之前,就被拒之门外。也留意能量花在哪里:几乎每一个要紧的步骤(装载一个 tRNA、移位、回收)都用 GTP 来支付,这就是为什么造蛋白质是细胞最耗能的事情之一。这台机器不是免费运转的;它是被买下来的,一次一个密码子。

在你继续向上攀登之前,有两点诚实的提醒。其一,“从核糖体里出来的链就是一条完工、能干活的蛋白质”这句话是个有用的简化,而非真相:一条刚出炉的多肽是一根软塌塌的线,它还得先折叠、还常常要被修饰,才能工作——而这正是本阶梯下一级要接着讲的地方。其二,要抵住“一个基因就是一个蛋白质”这种利落的虚构。同一段编码信息可以被读成不止一种产物(通过上游的可变剪接,以及起始密码子的选择),而那条链此后还可以被切割、装饰、编辑。你现在掌握的三幕故事,讲的是*一条*蛋白质是怎么造出来的;它是基因表达的脊梁,但它周围的躯体,要比一条笔直的线丰富得多。