密码本身跨不过去的那道鸿沟
在上一篇里,你破解了[[molbio-genetic-code|遗传密码]]:每个密码子——一串三个 RNA 字母——指定一种氨基酸,而这张表是从起始密码子开始、按固定的阅读框一路读下去的。可是请注意密码*没有*解释的东西。像 5'-GUG-3' 这样一个密码子,不过是三个碱基——一小段扁平的 RNA。它所代表的氨基酸缬氨酸,却是一个带支链、油性的分子,根本没有任何碱基。它们在化学上毫无共同之处。把密码子和氨基酸倒进同一支试管,它们只会彼此无视;碱基跟碱基配对,而碱基对氨基酸没有任何天然的抓握力。
所以这密码其实是一本没有内置译者的词典。书页上写着“GUG 表示缬氨酸”,可是当 GUG 出现时,究竟是谁去把缬氨酸取来呢?必须有什么东西在物理上把这两个世界搭起桥来——一边触碰 RNA 字母,另一边握住正确的氨基酸。那座桥就是一种叫做[[transfer-rna-adapter|转运 RNA]](即 tRNA)的小分子;弄懂它如何运作,正是理解一段字母信息究竟如何变成一条蛋白质链的关键所在。
一个折叠成工具的分子
一个 tRNA 是单股 RNA,长度只有约 76 个核苷酸——比起信使 RNA 来,小得多。但单股 RNA 不会乖乖维持一根软绳的样子。正如你在认识 RNA 二级结构时所见,RNA 会在自己的碱基能配对的地方折回去,形成由短双螺旋茎和不配对环顶组成的结构。在 tRNA 中,这种折叠如此稳定,以至于当你把它在纸上摊平时,它总是画出同一个形状——三个茎环从一个中央交汇处张开,而链的两端在顶部并拢。一代代教科书把它叫做三叶草结构。
不过三叶草只是摊平后的地图——真正的分子并不是平躺着的。在三维空间里,三叶草还会再折叠一次,把它的几条臂摆到一起,使整个分子坍缩成一个紧凑结实的 L 形(其实是倒 L)。这第二次折叠才是关键,因为它把分子的两个工作端尽可能地拉开——相距约 7 纳米——分别置于 L 的两个尖端。这样一来,tRNA 实际上就是一个坚硬的小把手,一端握着一个读码器、另一端挂着货钩,中间隔着一段稳固的距离。
这段间距并非装饰。在核糖体内部,读码的那个尖端必须向下伸到信使 RNA 上,而携带氨基酸的那个尖端则必须向上伸进蛋白质链正在组装的位置——这是发生在相距数纳米的两个点上的两份工作。通过把这两项功能固定在一个坚硬 L 的两个相对端点上,tRNA 才能同时干这两件事。请记住这幅整体图景;接下来我们逐一看这两个尖端。
一端读码:反密码子
在 L 的一个尖端,有一个环露出三个碱基——它们就是读码器。这三个碱基是[[molbio-anticodon|反密码子]],它们做的正是碱基最擅长的事:配对。当这个 tRNA 飘进核糖体时,它的反密码子会试着与此刻信息里那个密码子的三个碱基配对。如果这三个字母互补,它们就会按沃森-克里克配对扣合到一起——A 配 U、G 配 C——正是你从双螺旋起就一直用的那套配对规则,如今发生在两小段 RNA 之间。如果不匹配,这个 tRNA 就不会粘住,会飘走,让另一个候选者来试。
有一个细节几乎绊倒所有人,而它无非就是你已经熟知的反向平行规则。密码子与反密码子是首尾相对、走向相反地对齐的,所以比对时你必须把其中一个翻转过来。如果密码子读作 5'-GUG-3',它的反密码子就读作 5'-CAC-3'——把它们反向平行地配起来,每个碱基都对上。陷阱在于把反密码子“顺着”写成 CAC,又指望它和 GUG 同方向地对齐;其实它是反着放的。读取配对之前,永远要把它们反向平行地摆开,就像两条从相反两端合拢的拉链。
messenger RNA ... 5'-G U G-3' ... (the codon being read)
| | | antiparallel pairing
tRNA anticodon 3'-C A C-5' (written 5'-CAC-3')
L-shape: [anticodon tip] ---- 7 nm ---- [amino-acid tip]
holds: valine这解释了密码表里的一个谜:有 61 个密码子在指定氨基酸,可细胞用远少于 61 种的 tRNA 就能应付——常常只有约 40 种。怎么做到的?回想上一篇里的[[wobble-hypothesis|摆动]]概念。密码子第三个位置上的配对比较松,所以单个反密码子能读取好几个仅最后一个字母不同的密码子。因此一个 tRNA 就能覆盖一整族同义密码子。摆动正是密码的简并性——也就是它的同义现象——之所以划算的原因:细胞只需打造和维护一套规模适中的转接头工具箱,而不必为每个密码子各备一个。
另一端载货:给 tRNA 充载
在 L 的远端尖端,是携带氨基酸的那一端。每个 tRNA 都以相同的三个碱基 5'-CCA-3' 收尾,而氨基酸就挂到最末那个 A 上。带着氨基酸的 tRNA 叫做已充载(或氨酰-tRNA);空着的叫未充载。我们用它所载的货来标记一个已充载的 tRNA:携带甲硫氨酸的 tRNA 就记作 tRNA-Met。关键在于,氨基酸本身只是行李——一旦挂上,核糖体就再也不会去检查它了。核糖体只在另一端裁判反密码子与密码子是否匹配。
而这正是那枚悄悄埋下的炸弹。如果核糖体从不检查货物,那么*整套密码的准确性,就完全押在了一开始把正确的氨基酸挂到正确的 tRNA 上这件事上*。干这桩“牵线”活儿的,是一种叫做[[molbio-aminoacyl-trna-synthetase|氨酰-tRNA 合成酶]]的酶。大致是每种氨基酸对应一种这样的酶——大约二十种——而每一种都必须完成一次双重识别:它必须从一群分子中挑出它那一种正确的氨基酸,又挑出正确的 tRNA(读取该 tRNA 身体的特征、常常还有它的反密码子),然后动用 ATP 的能量把两者焊接到一起。
- 选定氨基酸:合成酶抓住某一种特定的氨基酸,靠的是一个按其大小和侧链形状量身定做的口袋——当氨基酸彼此差异大时这很容易,当两者几乎一模一样时就很难(想想缬氨酸和异亮氨酸,它们只差一个甲基)。
- 用 ATP 活化它:酶花掉一个 ATP 给氨基酸充能,使它处于蓄势待发的活泼状态(正是这份储存的能量,让它之后无需额外燃料就能并入蛋白质链)。
- 选定正确的 tRNA 并挂载:同一个酶识别出正确的 tRNA,把活化了的氨基酸转移到它 3' 端的 CCA 上,造出一个可供核糖体使用的已充载 tRNA。
- 校对(针对那些难分辨的对子):许多合成酶还有第二个“编辑”口袋,一旦有错误的氨基酸蒙混过关,就把它销毁——这是一道内置的拼写检查,把出错率压到大约万分之一甚至更低。
为何合成酶才是密码真正的守门人
退一步,看看密码的意义究竟住在哪里。“这个密码子表示这个氨基酸”这条词典条目,既没写在密码子里,也没写在核糖体里。它是在充载的那一刻被强制确立的:是合成酶决定了哪种氨基酸被熔接到哪个带着反密码子的 tRNA 上。tRNA 不过是个忠实的快递员;真正往信封里装东西的是合成酶。所以合成酶才是遗传密码真正的守护者——“GUG 表示缬氨酸”这条规则,正是在它那里被物理地强加给细胞的。
一个经典实验把这一点说得令人难忘。取一个正确充载的半胱氨酸-tRNA(其反密码子读取半胱氨酸密码子,且正确地带着半胱氨酸),然后在充载*之后*,用化学手段把它挂着的半胱氨酸转变成丙氨酸。如今把它喂给核糖体。核糖体会一丝不苟地在每一个出现半胱氨酸密码子的地方插入丙氨酸——因为它从头到尾只读反密码子,并信任那份货物。教训很鲜明:核糖体不核对意义;合成酶装载了什么,核糖体就安装什么。准确性是在前端、在充载时就买好的,而不是在读取的那一刻。
把 tRNA 放回它的位置
于是 tRNA 化解了我们一开篇就摆出的那道鸿沟。反密码子那一端说的是信息的语言——碱基与碱基配对。携带氨基酸的那一端说的是蛋白质的语言——一块随时可被连接的原料。坚硬的 L 把这两种语言固定地隔开一段距离,好让单个分子能同时跨立于两个世界。这正是克里克用的那个词——*转接头*——的全部含义:一个把两样本来绝不会直接对接的东西配到一起的部件。
这里还藏着一个更深的暗示。tRNA 是一个折叠成精密三维工具、并实际干活的 RNA 分子——它预示了[[rna-world-hypothesis|RNA 世界]]的设想:很久以前,掌控大局的是 RNA、而非蛋白质。你在紧接着的下一篇里就会看到这个主题再度回归,那里核糖体竟然也是用 RNA 来完成它最核心的化学反应的。tRNA 是 RNA 不仅是被动信息、还能充当工作机器的第一个清晰迹象。
词典和转接头都已在手,只差那间车间了。下一篇将请出核糖体——这台古老的机器握住信息,每次接纳读取三个字母的已充载 tRNA,依次把它们的氨基酸连起来,从而最终走完中心法则最后那个箭头:RNA -> 蛋白质。