弄懂一节,就懂了整条链
在化学那一关里,你学过单体—聚合物原理:生命把小小的、大体相同的单元扣成链,从而搭起它的长分子。DNA 和 RNA 正是这个思路,而我们终于要在这里与它们那唯一的建筑模块面对面了。这个单元就是核苷酸,整个这一关的诀窍很简单——弄懂一节,你就懂了整条链,因为一条 DNA 链不过是成千上万乃至上百万个核苷酸首尾相接,就像自行车链条上的链节。
每个核苷酸都由恰好三个部分扣在一起。第一是含氮碱基——携带信息的“字母”(A、G、C、T 或 U)。第二是一个五碳糖,碱基就挂在它上面。第三是一个或多个磷酸基团,也就是你在“反应偶联”里见过的那种由磷和氧组成、带负电的小团块。碱基朝侧面伸出来拼出一段信息;糖和磷酸接起来形成链条。把这三个部分牢牢记住,分子其余的行为都能从中推得出来。
一字之差的陷阱:核苷与核苷酸
有两个词只差一个字母,几乎把每个人都绊倒,我们现在就把它们厘清。核苷就是碱基连着糖——三个部分里的两个,没有磷酸。核苷酸则是获得了一个或多个磷酸基团的核苷——三个部分齐全。区别就在那个磷酸,仅此而已。一个简单的记法:核苷“酸”里多了个“酸”字,磷“酸”也有这个字——带“酸”的那个,就是带磷酸的那个。
这不是咬文嚼字——细胞是真的在意。只有带着带电磷酸的核苷酸才能被连进链里,因为正是磷酸去和下一个糖成键。光秃秃的核苷无可成键。这也正是为什么有些抗病毒和抗癌药物是“核苷类似物”:假的碱基加糖,细胞误以为是真货、把它加到正在延长的链上,从而卡住复制机器。那一个磷酸,就是一个惰性的备用零件和一个能用的链节之间的差别。
四字母的字母表——以及它的两种尺寸
信息完全活在碱基里。含氮碱基是一种扁平、富含氮的环状分子(名字由此而来),重要的只有五种:腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)。DNA 用 A、G、C、T;RNA 把 T 换成 U,用 A、G、C、U。这就是全部的字母表——一个约三十亿个字母的人类基因组,通篇只是这四个字符反复出现,就像图书馆里每一本书都是用同样的二十六个字母写成的。
下面这个细节稍后会派上用场:这四个字母分两种尺寸。嘌呤——腺嘌呤和鸟嘌呤——由两个稠合环构成,是大的、双环的字母。嘧啶——胞嘧啶、胸腺嘧啶、尿嘧啶——由一个环构成,是小的字母。一个好记的口诀是“嘌呤是 A、G 一伙”——PURine 对应 Adenine 与 Guanine。这种尺寸差异并非冷知识:在下一篇你会看到,大嘌呤总是伸过去与小嘧啶配对(A 配 T、G 配 C),于是螺旋的每一级横档都一样宽。这正是本关后面讲双螺旋那篇能成立的原因。
不过得对这个简化说法坦诚一点。“四字母字母表”是标准的讲法,也大体公允——但细胞确实悄悄还用着几个别的字符。甲基化的胞嘧啶,以及 RNA 中许多经过化学修饰的碱基都很常见,并承载着真实含义。(这些碱基在化学上还略带碱性,这一点连同其中的氮,正是“含氮碱基”这个名字的由来。)真正的字母表带有化学脚注;其中一些我们会在后面的关卡里再谈。
那个糖:一个氧分出 DNA 与 RNA
碱基携带信息,但悄悄决定你手里是 DNA 还是 RNA 的,是那个糖。两者都用一种五碳环糖,区别只在一个氧原子。RNA 的糖是核糖,它在编号为 2' 的碳上带着一个羟基(一个 OH)。DNA 的糖是脱氧核糖——字面意思就是在那个 2' 位上“少了一个氧”的核糖。所以两种糖在结构上唯一的区别,就是 2' 碳上的一个 OH:核糖有,脱氧核糖没有。这就是藏在 DNA 与 RNA 名字里的那个 D 与 R 之别。
这一个缺失的氧解释了出奇多的事。多出的 2' OH 让核糖更活泼、远不如脱氧核糖稳定——RNA 能攻击自己的骨架并断裂——这部分解释了为什么 RNA 是短命的工作副本,而 DNA 是耐久的主档案。人们已经从数万年前的骨头里读出过古代 DNA;却没有人指望能用同样方式回收完整的古代 RNA。等我们讲到中心法则(DNA -> RNA -> 蛋白质)时,正是这种稳定性差异,让细胞把信息存放在结实的 DNA 里,再派出用完即弃的 RNA 副本去做日常工作。
- 从糖开始——一个五角的环,碳从 1' 编到 5'。
- 在 1' 碳上扣一个碱基。现在你有了一个核苷(碱基+糖)。
- 在 5' 碳上挂一到三个磷酸。现在它是个核苷酸了——完工的链节。
- 要长出一条链,细胞就把新链节 5' 角上的磷酸接到上一节空着的 3' 角上——再重复,重复几千次。
同一种分子,也是细胞的燃料
下面这个联系,把这一篇接回到化学那一关。取核苷腺苷(腺嘌呤+核糖),给它挂上三个磷酸,你就得到了ATP——正是我们谈“把一个不利反应偶联到一个有利反应”时认识的那个能量货币。ATP 并不是另外某种独立的能量化学品;它实实在在就是一个带着三个磷酸(而非一个)的 RNA 核苷酸。细胞的信息分子和它的动力供应,原来是用同一套零件做成的。
为什么是三个磷酸?这些磷酸各自带负电,把三个挤在一起就像压紧一根弹簧——它储存了能量。掰掉最外侧那个磷酸会释放这份能量(一个强烈为负的 delta G,也就是你早先认识的自由能变化),细胞便用它来驱动做功。这同时也解答了本关里的一个谜题:搭建一条链要耗能,所以细胞并不添加光秃秃的核苷酸——它添加的是核苷三磷酸(比如做 DNA 用的 dATP),让两个磷酸掰掉、为每一个新链节扣到位提供动力。信息与能量,一族分子身兼两职。
ASSEMBLE A LINK: base --on 1'--> sugar = NUCLEOSIDE (e.g. adenosine) nucleoside --on 5'--> phosphate = NUCLEOTIDE (AMP, 1 phosphate) add 2 more phosphates = ATP (still a nucleotide; the cell's fuel) CHAIN THEM (always 5' -> 3'): 5'-(P)-sugar-base ... 3'-OH + (P-P-P)-sugar-base-3' -> new bond joins 3' of the chain to 5'-phosphate of the next link -> 2 phosphates snap off, releasing energy