没有新东西,只是新的搭法
蛋白质是一种聚酰胺,脂肪几乎是一种聚酯——上几篇指南里你已经看到了这些呼应。核酸是第三大生物聚合物,而令人安心的消息是:它根本没有藏着任何新化学。把 DNA 拆开,你找到的全部原料,都是你早已见过的官能团工具箱:一个充当碱基的芳香杂环、一个五碳糖、一个磷酸酯。全部的巧妙之处,仅仅在于这三样东西是怎么卡接到一起、再串成一条链的。
我们先把术语钉死,因为这些名字一开始把每个人都绕晕过。核苷就是碱基连上糖——两块。核苷酸是核苷再加上一个或多个磷酸基团栓在糖上——三种零件。核苷酸是单体,是那块单独的乐高积木;核酸则是成千上万块这样的积木连成的一条长聚合物。所以整门课题就是:那三块零件是什么,是什么键把一块积木内部固定住,又是什么键把一块积木连到下一块?
碱基:负责传话的芳香环
信息就住在碱基里,而它们是平展、富含氮的芳香环——是你在芳香篇里见过的吡啶和吡咯杂环的直系亲属。它们有两种形状。嘧啶类(胞嘧啶、胸腺嘧啶、尿嘧啶)是一个带两个氮的六元单环。嘌呤类(腺嘌呤、鸟嘌呤)更大:一个六元环并合一个五元环,总共四个氮。两者都是货真价实的芳香性——平展、完全共轭、带着恰好 4n+2 个离域的 π 电子——这正是它们在化学上耐受、平面、并能像硬币一样堆叠的原因。
凑近看每个环的边缘,你就会找到日后负责碱基配对的那些官能团:环上的 N-H 键、羰基 C=O,以及氨基 -NH2,全都朝外指着。这里有一处值得弄准的细节。芳香环上的一个羰基,原则上可以以 C=O(酮式)存在,也可以以芳香 -OH(烯醇式)存在;同样,氨基可以是 -NH2,也可以是 =NH。对每一个碱基而言,大自然采用的形态——也是压倒性地实际存在的那一个——是酮式/氨基式,而非烯醇式/亚氨式。这个选择并非随意:正是它呈现出正确的氢键给体与受体图案。这就是羰基篇里那套酮-烯醇逻辑,如今正悄悄决定着遗传密码读得对不对。
糖,与糖苷键
碱基并不是自由飘着的;它骑在一个五碳糖上,那是一种叫核糖(在 RNA 里)或 2-脱氧核糖(在 DNA 里)的单糖。这个糖处于它的环形式——而你应当记得,那个环是一个环状半缩醛:链上的醛被它自己的一个羟基在分子内捕获,留下一个特殊的端基碳(C1'),它同时带着一个 -OH 和那个环氧。那个端基碳就是反应的把手,正如在糖类指南里糖与糖形成糖苷键时一样。
要把碱基接上去,糖的端基 -OH 就被碱基的一个氮所取代。结果就是一个 N-糖苷键——和普通糖苷键一样,是形成缩醛的同一步,只不过进来的亲核试剂是一个环上的氮,而不是另一个糖的氧。从机理上看,端基 -OH 离去(它是个半缩醛,所以这个位置很容易形成一个稳定化的正离子),碱基的氮进攻 C1',于是你就通过一根 C-N 键把碱基锁在了糖上。这根键在 DNA 里很牢固,恰恰因为它是一个完整的缩醛型连接,而非游离的半缩醛——端基碳如今两侧都被封住,再也无法打开回到那个活泼的醛。
那唯一缺失的氧——核糖在 2' 位带一个 -OH,而脱氧核糖那里只是一个 -H——就是 RNA 与 DNA 之间全部的化学差异,而它的后果之大超乎比例。RNA 的 2'-OH 是一个内建的亲核试剂,就坐在主链的旁边;它能转过身去进攻邻近的磷酸,把链切断。DNA 缺了那个羟基,就没有这样一个内部的破坏者,因此稳定得多。一个诚实的结论:“脱氧”不是一条次要的脚注——它恰恰就是为什么是 DNA、而不是 RNA,成了基因组的长期档案库。
磷酸二酯主链
现在我们把积木串起来,而磷酸正是在这里发挥它的价值。磷酸 H3PO4 有三个 -OH,所以它最多能形成三个酯键。在主链里,它恰好形成两个:一个酯连到一个糖的 3'-OH,第二个酯连到下一个糖的 5'-OH。一个磷酸通过两个酯键桥接两个醇,就叫一个磷酸二酯(“二” = 两个酯)。把它们一个接一个连下去——糖、磷酸、糖、磷酸——你就搭出了那条贯穿整个分子全长的连续主链。
one strand, read 5' -> 3':
5'-end
|
[sugar]--base
| (3')
O
|
-O-P=O <- phosphodiester:
| TWO ester C-O-P bonds,
O ONE -O- left over, carrying
| (5') a negative charge at body pH
[sugar]--base
| (3')
O
|
-O-P=O
|
...continues...
|
3'-end
third -OH of each phosphate stays free and ionized: -O(-)这个设计带出三条诚实的后果。第一,每个磷酸上剩下的那个 -OH 是酸性的(第一个质子的 pKa 接近 1-2),所以在细胞内部的 pH 下它是去质子化的——主链每个核苷酸带一个负电荷。这正是为什么这些分子被称为核“酸”,也是为什么整条链是一个聚阴离子,会自我排斥,从而需要反离子和蛋白质来帮它折叠。第二,这条链有真正的方向:一端以游离的 5'-磷酸收尾,另一端以游离的 3'-OH 收尾,而生物学总是从 5' 向 3' 去读、去建。第三——这就是那层家族相似——每形成一个连接都要排出一分子水,所以核酸和蛋白质一样,是一种缩聚物。
碱基配对:靠氢键握住的信息
我们有了一条链。双螺旋则是两条链面对面地握在一起,而那胶水是整个分子里最弱的力:氢键。回想那条规则——一个氢键需要一个给体(连在 N 或 O 上的 H)和一个受体(N 或 O 上的一对孤对电子)。碱基的边缘上恰恰镶满了这些:N-H 和 -NH2 是给体,C=O 和环氮上的孤对电子是受体。当两个碱基的给体与受体互补地对齐时,它们就配对了,就像一把钥匙跨过两链之间的缝隙正好插进一把锁。
- 先看尺寸。一个嘌呤(大,双环)总是和一个嘧啶(小,单环)配对。两个嘌呤会太胖塞不进缝隙,两个嘧啶又太瘦,所以只有大配小才能让每一格都一样宽——正是这个几何让螺旋保持平顺。
- 再看图案。在大-小的各种可能里,只有 A 配 T、G 配 C 才真正让给体对上受体。A 和 T 呈现一个匹配的两键图案;G 和 C 呈现一个匹配的三键图案。错误的配对会把给体对上给体——那是顶撞,而非紧扣。
- 数一数键。A=T 由两个氢键握住;G≡C 由三个。所以一段富含 G 和 C 的 DNA 被粘得更紧,需要更多的热才能拉开——这是一个真实、可测量的差别,不是比喻。
不过对“是什么让螺旋握得住”要诚实,因为氢键只是故事的一部分。每一个氢键单独看都很弱——只有真正共价键的百分之几——单凭一个,根本敌不过水分子的推搡。有两样东西救了它。第一,它们成千上万地排成一列,许多个弱握加起来就成了一个牢固的握(这和让壁虎挂在玻璃上的协同逻辑是一样的)。第二,也许更重要:平展的芳香碱基像一卷硬币那样一个叠一个,而这种碱基堆叠——范德华接触与 π 体系交叠的混合——贡献了真实稳定性的很大一部分。氢键负责挑出正确的搭档;堆叠和那纯粹的数量,才让结构经久。
为什么这个设计行得通
退后一步,这个分子的精妙就在于强键与弱键之间的分工。主链由强的共价磷酸二酯键握住——碱基的序列,也就是真正的信息,是用不可擦的墨水写就的,不会自己散架。两条链彼此之间,则只靠弱的、可逆的氢键握着。这恰恰是你想要的:要复制或读取信息,你必须短暂地把两条链拉开拉链,而一种弱的、可逆的胶水,能让一个酶把它们剥开再重新封好,却从不切断那条永久的主链。强键负责储存;弱键让你能读取。
而互补配对,正是使复制成为可能的那个机关。因为 A 只配 T、G 只配 C,每条链都是另一条的完美底片:知道一条序列,你就能一个字母一个字母地推出另一条。要复制,细胞就把螺旋拉开,让每条旧链充当模板,靠碱基配对把游离的核苷酸排好队,再缝合它们的磷酸二酯主链——正是上一节那套缩合化学,如今由一个酶来跑。你整条阶梯一路学来的化学,归根结底,就是一个细胞如何记住它自己是什么。
把几条诚实的提醒带着往下走。碱基是芳香杂环,不是随便什么环——它们的平整,以及它们固定的酮式/氨基式互变异构体,正是可靠配对得以成立的前提;一个翻成错误互变异构体的碱基会错配,从而造成突变。氢键按设计就是弱的、可逆的,而且它们并非独自工作——碱基堆叠承担了很大一部分负荷。而那个区分 RNA 与 DNA 的单独的 -OH,不是一条脚注,而是为什么一种分子归档基因组、另一种则是可弃用的工作副本的根本原因。把这些握住,你理解的核酸就是作为化学的核酸,而不只是一张生物课本里的示意图。