JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

RNA 的众多种类

信使 RNA 不过是一个庞大家族里最出名的成员而已。来认识那些建造蛋白质、运转剪接机器、悄悄把基因开开关关的 RNA——以及那个改变了整个领域的发现:基因组几乎处处都在被转录,远不止于我们早已知道的那些基因。

信使之外:一整个家族

在这一级里,你目前跟着一条 RNA 走完了它的一生:一条编码蛋白质的转录本,经过加帽、加尾,被剪接成成熟的信使 RNA(mRNA),再被送出去读成蛋白质。这个故事让 RNA 听起来像个信使——一张用完即弃的纸条,按 DNA -> RNA -> 蛋白质 的精神,把信息从基因送到核糖体。这幅画面没错,但它只是一个大得多的房间里的一个小角落。mRNA 只是 RNA 的一种,而在一个典型细胞里,它远不是最多的那一种。

本篇指南正是围绕这样一个重新定位展开的。RNA 不只是信息的*携带者*;它还是*工人*,也是*建材*。你在核酸那一级见过的同一套化学——一条能折回自身、按 A-U 与 G-C 配对、形成发夹和口袋的单链,正如你在 RNA 二级结构里看到的那样——让一条 RNA 能够采取精确的三维形状。一个折叠好的形状能抓住另一个分子、坐镇某台机器的核心,甚至能加快一个化学反应。所以在我们继续讲翻译之前,值得先做一次人口普查:这些 RNA 都是谁,每一种又究竟在做什么?

建造蛋白质的班底:tRNA 与 rRNA

下一级整级都在讲翻译——把一条 mRNA 变成一个蛋白质——而这件事靠的是两种非编码 RNA,你现在就该认识它们,因为它们是细胞里最忙碌的 RNA。第一种是[[transfer-rna-adapter|转运 RNA(tRNA)]]。把它想成一个两头的接头:一条小小的、折得紧紧的 RNA,形状有点像一片三叶草,再揉皱成一个 L,一端有一个三字母的环,另一端有一个停放一个氨基酸的车位。那个三字母环读取 mRNA 上的一个密码子;那个车位载着相匹配的氨基酸。实际上每条 tRNA 都是把一个密码子实实在在地翻译成一个氨基酸——这是细胞用分子、而非纸张写成的字典。

第二种是核糖体 RNA(rRNA)——而真正令人震惊的就在这里。核糖体,那台把氨基酸连成链条的两部分组成的大机器,主体是 RNA,而不是蛋白质。几十年里,人人都以为核糖体里的蛋白质负责化学反应,而 RNA 只是把它们固定到位。结果真相恰恰相反:把一个氨基酸连到下一个氨基酸的那个键,是由 rRNA 自己锻造的,地点在大亚基深处一个没有任何蛋白质能够到达的位置。换句话说,核糖体是一种核酶——一种 RNA 酶。蛋白质是脚手架;RNA 才是催化剂。我们下一级会正式打开这台核糖体,但请先记住这一点:那台造出你全部蛋白质的机器,是由 RNA 来运转的。

这两种 RNA 解释了一个让初学者吃惊的数字:按质量算,一个忙碌细胞里的 RNA 有八成以上是 rRNA 和 tRNA,而 mRNA 只占百分之几。我们花了整整一级讲的那个信使,按数量算其实是少数派。这是最干净利落的一个迹象,说明 RNA 在细胞里的主要本职工作根本不是传递信息——而是建造蛋白质。

机器的零件工:剪接与修饰的小 RNA

其实你已经认识了第三类,只是当时没有点出它的名字。回想本级前面那篇讲剪接的指南:小核 RNA(snRNA)——U1、U2、U4、U5、U6——正是剪接体的催化与识别核心。每条 snRNA 都被蛋白质包裹成一个 snRNP(一个 snurp),它们合力靠把自己的 RNA 字母与前体 mRNA 进行碱基配对来找到内含子的两端,然后弯折、切割。和核糖体一样,剪接核心处的化学反应也是由 RNA 完成的。所以细胞里两台最大、最重要的机器——造蛋白质的那台和编辑 RNA 的那台——其核心都是 RNA 酶。

还有一个表亲,值得用一句话点到,好让你日后认得这个名字:核仁小 RNA(snoRNA)。它们是一些短小的向导 RNA,会与一条刚造好的 rRNA 上的特定位点进行碱基配对,并指引对它做化学微调——这里加一个甲基,那里转换一个碱基——在核糖体的 RNA 上岗工作之前先把它精修一番。这里反复出现的手法,与 tRNA 和那些 snRNA 所用的是同一套:一条 RNA 靠拼出一段互补序列、字母对字母地找到自己的靶点。碱基配对,就是 RNA 通用的“寻址系统”。

调控者:把基因调高调低的 RNA

现在来看最大程度重塑了现代分子生物学的那一类:以*控制*其他基因为本职的 RNA。当家的主角是[[molbio-microrna|微小 RNA(miRNA)]]——一条极小的 RNA,只有约 22 个字母长,本身不编码任何东西。它的工作方式,是与一条靶 mRNA 上一段相匹配的序列进行碱基配对,再在一个蛋白质搭档的帮助下,要么阻止那条 mRNA 被翻译,要么给它打上销毁的标记。一条 miRNA 能同时压低几十甚至上百条不同的信息,所以一条小小的 RNA 就像一个音量旋钮,把一整排基因调低。你的基因组编码了一千多种这样的 RNA,它们帮着设定一个细胞各造多少每一种蛋白质。

近亲是小干扰 RNA(siRNA),它走的是同一套机器——RNA 干扰(RNAi)通路。两者的差别主要在来源:miRNA 由你自己的基因组编码,用来调控你自己的基因;而经典意义上的 siRNA 来自一条双链 RNA,往往是病毒的,并把它沉默掉。它们共用的路线很优雅:一条较长的双链 RNA 被一种酶切成短片段,其中一条链被装入一个蛋白质复合体,这个复合体随后去搜捕任何与所装链相匹配的 mRNA,将其沉默。这又是碱基配对——把一小段 RNA 当作一条搜索查询,去比对整池信息。这一发现奠基之深,赢得了诺贝尔奖,而且已被做成了一类药物:已获批的几种药正是人工合成的 siRNA,专门设计来关掉某一个致病基因。

再来看长度上的重量级选手:[[long-noncoding-rna|长非编码 RNA(lncRNA)]],宽松地定义为任何长度超过约 200 个字母的非编码转录本。它们并不靠某一种利落的机制工作;它们是个大杂烩。有的充当脚手架,把若干蛋白质聚到一处;有的充当诱饵,把某种 miRNA 吸附走;有的把基因沉默机器引导到染色体的某一段上。其中最著名的 Xist,会包裹住整整一条 X 染色体,把它关掉——这正是X 染色体失活背后的机制,它让雌性哺乳动物得以平衡 X 连锁基因的剂量。一条 RNA,而非蛋白质,去沉默整条染色体:这正是没人料到 RNA 会扮演的那种角色。

基因组处处在说话:普遍转录

退后一步,一个更大的发现就清晰起来了。当生物学家最初读取基因组时,他们想象的是一片整洁的地貌:一座座蛋白质编码基因的岛屿,被一望无际、沉默无声的所谓垃圾 DNA沙漠隔开。后来他们做了一件简单却有力的事——不去测 DNA,而去测 RNA,追问基因组究竟有哪些部分真的被转录了。答案推翻了那幅画面。基因组绝大部分都会在某个时刻、某种细胞里被抄成 RNA,尽管其中只有约百分之一到二真正编码蛋白质。这就是[[pervasive-transcription|普遍转录]]:基因组并不是沙漠中的零星几个基因,它几乎处处都在说话。

这正是为什么“垃圾 DNA”是个过早下的标签,而它又与你刚认识的那些调控 RNA 严丝合缝:那大量的普遍转录中,有很多正是产出 miRNA、lncRNA 以及其他用来微调基因组的非编码 RNA。但在这里,诚实同样重要,它和前面对 lncRNA 的告诫是同一枚硬币的两面。普遍转录是真实且有充分记载的;有争议的是其中有多少 RNA 是*有功能的*,又有多少只是生物学上的背景嗡鸣——因为基因组处于开放、活跃状态而发生的转录,并非每一条转录本都承载意义。“基因组大部分都被转录”这一点已成定论。“因此基因组大部分都有功能”却不会自动成立;那是另一个问题,至今仍在争论。

为什么偏偏是 RNA,会身兼这么多职务——信息、机器、催化剂、调控者?最主流的答案要回溯到几十亿年前。RNA 既能像 DNA 那样把信息存在它的序列里,又能像蛋白质那样折成会做化学反应的形状。RNA 世界假说提出:早期生命曾仅靠 RNA 运转,那时 DNA 和蛋白质还没接管存储与劳作。果真如此,那么你核糖体核心处的 rRNA、你剪接体里的那些 snRNA 就不是什么怪癖——它们是活化石,是至今仍在干着核心活计的古老 RNA 酶,而那些活计早在蛋白质出现之前它们就在干了。这一个念头把整次普查串到了一起:RNA 是调控者、是工人、是建造者,正因为很久很久以前,它就是一切。

一张“哪种 RNA 做什么”的地图

下面把全体角色收在一张卡片上。与其把它当作一份要背的清单,不如把它当作一组职务来读,按我们开篇用过的那个划分排列——携带者,对上工人和建造者。箭头表示每种 RNA 作用于什么;留意那个动词有多频繁是“碱基配对于”,这一招处处都在出现。

CARRIER (coding)
  mRNA   -> carries a gene's message to the ribosome; gets translated into protein

BUILDERS / WORKERS (non-coding, run the machines)
  tRNA   -> adapter: matches one codon to one amino acid during translation
  rRNA   -> the ribosome's core; an RNA enzyme that bonds amino acids together
  snRNA  -> U1/U2/U4/U5/U6; the catalytic core of the spliceosome (cuts introns)
  snoRNA -> guides chemical fine-tuning of rRNA by base-pairing to it

REGULATORS (non-coding, tune other genes)
  miRNA  -> ~22 nt; base-pairs to mRNAs to block or destroy them
  siRNA  -> same RNAi machinery; silences viral or matching RNA
  lncRNA -> >200 nt; scaffolds, decoys, guides (e.g. Xist silences an X chromosome)

BACKDROP
  pervasive transcription -> most of the genome is copied to RNA; how much is
                             functional vs. background is still debated
RNA 普查:一种会变成蛋白质的携带者,以及许多去建造机器或调控基因的非编码 RNA。

留意这一切给你登上这道阶梯之初的那幅中心法则图景带来了什么。DNA -> RNA -> 蛋白质 仍然是主干交通,它没有错——但中间那个箭头并不只是一道穿堂而过。对基因组的大部分产物而言,RNA 本身就是一个终点。它携带信息,没错,但它同样构成了去读那些信息的机器,还回过头来掌管哪些信息得以被造出、被使用。诚实而现代的看法不是“RNA 是个中间人”,而是“RNA 是个完完全全的角色——有时是信使,常常是工人,偶尔是老板”。