中心法则 — JOVANA Education

一张图，托住整个领域

在上一篇指南里，你已经认识了分子生物学的主角：DNA、RNA 和蛋白质，以及让它们彼此结合的化学原理。现在，我们让它们动起来。这个领域里最有用的一个观念——你会一次又一次用到它——就是[[molbio-central-dogma|中心法则]]：它讲的是*信息*在这些分子之间朝哪个方向流动。它不是一条物理定律，而是对细胞实际所作所为的一段极其精炼的概括；学会读懂它，就像在出发徒步前先拿到了地图。

下面就是那个著名的核心，用纯文本写出来：DNA -> RNA -> 蛋白质。DNA 复制自己（复制），DNA 被读取成 RNA（转录），RNA 又被读取成蛋白质（翻译）。这就是活细胞内部信息流动的日常往来。三种分子，三个箭头。这架阶梯上几乎其余的一切，都不过是在详细回答：其中某个箭头*如何*运作、细胞*何时*决定沿着它发出信息，以及当机器出错时*会发生什么*。

        replication
          (loop)
            |
  DNA  --transcription-->  RNA  --translation-->  PROTEIN
   ^
   |__ reverse transcription (from RNA, by special enzymes)

日常流动从左到右；复制让 DNA 回环到 DNA；逆转录则是那个著名的例外，方向为 RNA -> DNA。

每个箭头到底在做什么

我们一个箭头一个箭头地看，因为每一个都是由分子机器完成的、实实在在的物理复制工作。复制是 DNA 在细胞分裂前造出第二份 DNA 的方式。回想上一篇里反平行的双螺旋——两条链朝相反方向延伸，A 总是伸过去与 T 配对，G 与 C 配对。细胞把两条链拉开，分别以每条为模板造出一条新的搭档链，于是每个子细胞都继承一条旧链和一条新链。这种一半旧、一半新的优雅模式叫做半保留复制，它也正解释了为什么碱基配对规则如此重要：一条链上的序列决定了另一条链的序列。

[[transcription-overview|转录]]把一段 DNA——一个基因——抄写成一份简短的、单链的 RNA 工作副本。可以把 DNA 想成锁在图书馆里的母本档案，把 RNA 想成你能带到工作台上的一次性复印件。它遵循同样的碱基配对逻辑（只是 RNA 用 U 代替 T），由一种叫做 RNA 聚合酶的酶来完成抄写。由于细胞只在需要某个基因的产物时才新造一份 RNA 副本，转录便成了细胞*决定*开启什么的主要场所——这个控制节点，在之后几乎每一级阶梯上我们都会重访。

[[molbio-translation-initiation|翻译]]读取 RNA 信息并造出蛋白质。著名的遗传密码就在这里登场：RNA 每次读三个字母，每个三字母的密码子指定要往不断生长的蛋白质链上添加的一个氨基酸。比如读到 5'-AUG GCU UUU-3'，意思就是：起始，然后丙氨酸，再然后苯丙氨酸。在物理上把密码与氨基酸对应起来的分子，是一种小小的转接器——转运 RNA（tRNA），整个组装过程在核糖体上进行。所以这些箭头不是比喻——它们是三台不同的复制机器，每一台都执行着一套清晰的配对规则。

克里克的真正主张（以及那个著名的误读）

这是整篇指南里最重要的一处坦诚。弗朗西斯·克里克在 1958 年提出了中心法则，而人们从那以后就一直在误引它。流行的说法——“信息只能从 DNA -> RNA -> 蛋白质流动，*绝不可能*倒着走”——并不是克里克的本意。他选用“法则（dogma）”这个戏剧性的词，部分是出于一种俏皮的玩笑，而且他对这条主张究竟涵盖什么是很谨慎的。

克里克*真正*主张的，要狭窄、也要精确得多：信息一旦*进入*蛋白质，就再也无法从蛋白质里*出来*、回到核酸中去。在他的表述里，序列信息可以在核酸之间自由流动，也可以从核酸流向蛋白质，但大自然唯一禁止的方向，是蛋白质 -> 核酸。蛋白质的氨基酸顺序，永远不能被当作模板来书写一段新的 RNA 或 DNA 序列。这——而且仅仅是这一条——才是中心法则真正划下的那条线。

除了咬文嚼字之外，这个区分为什么如此要紧？因为逆转录并不是一条罕见的脚注——它正是逆转录病毒把自己拷贝进我们基因组的方式，是一项关键实验技术（RT-PCR，许多诊断检测背后的引擎）读取 RNA 的方式，也是我们自身基因组在演化中积累某些片段的方式。若把“倒流＝不可能”当成法则，就会让你对整整一层生物学视而不见。而诚实的版本既守住了这一层，又依然抓住了那个深刻的真理：蛋白质是信息流的终点，永远不是源头。

跟着一条信息，从基因走到蛋白质

让我们跟着一条信息，像一个忙碌的细胞那样，走完这些日常箭头。这整段旅程就叫做基因表达——把基因里那份安静的信息，变成一个能干活的分子。请记住那个复印件的比喻：任何东西都绝不会被写回母本档案上去。

细胞需要某种特定的蛋白质，于是它在 DNA 上找到对应的那个基因——序列中一段界定明确的区段——并在那里把双螺旋打开。
RNA 聚合酶读取其中一条 DNA 链，转录出与该基因相匹配的一份 RNA 副本；这份信使 RNA 用同样的 A/U/G/C 语言写成，把这道指令带到造蛋白质的地方去。
核糖体夹住这条 RNA，从起始密码子 AUG 开始，以三字母为单位的密码子逐个读取它。
对每一个密码子，一个相匹配的 tRNA 送来正确的氨基酸，核糖体把氨基酸一个个连成一条链——这就是蛋白质，忠实地照着基因的字母造出来。
造好的链折叠成一个能工作的形状，去完成它的任务——到这里就是终点：它的序列绝不会被抄回到 RNA 或 DNA 里去。

在你把“一个基因 -> 一种蛋白质”记进脑子之前，有一处需要诚实说明：这句整齐的口号已经过时了。在我们的细胞里，单个基因的 RNA 副本可以被以不同方式剪开再重新拼接——这就是可变剪接——于是一个基因可以产出好几种不同的蛋白质。中心法则的那些箭头依然完全成立；法则讲的是信息的*方向*，而不是一对一的数目。我们会在往上几级的阶梯上，把剪接好好讲清楚。

为何这一张图为之上的一切定下框架

一旦这些箭头住进了你的脑子，阶梯上其余的部分就会自动围绕它们组织起来。后面的每一级，本质上都是举着一面放大镜，照向这张图的某一处：复制那一级，放大 DNA -> DNA 那个回环及其惊人的精确度；转录与 RNA 那几级，放大 DNA -> RNA，以及细胞随后对信息所做的一切；翻译与蛋白质折叠那几级，放大 RNA -> 蛋白质，以及造好的链最终会变成什么。而基因调控所问的，是*哪些*箭头被触发、*何时*被触发。你不是在背一堆互不相干的事实——你是在往同一张共享的地图上填空。

这张图还告诉你：哪里可能出错，以及生物学在哪里变得有趣。DNA 里的一个笔误——一处突变——可能改变一个密码子，从而改变一个氨基酸；这类改变大多无害或沉默，少数有益，少数则致病。有些 RNA 根本不会变成蛋白质，却以 RNA 的身份做着实实在在的工作，这暗示着一个远古的 RNA 世界——在那时，也许在 DNA 与蛋白质出现之前，是 RNA 在主持大局。还有，极少数情况下，一个蛋白质的*形状*能让同种蛋白质的其他拷贝也变坏——这就是朊病毒（prion）——它看起来像是蛋白质在传递信息，可它依然从不去改写基因，所以法则真正的边界依旧成立。