核酸 — JOVANA Education

没有新东西，只是新的搭法

蛋白质是一种聚酰胺，脂肪几乎是一种聚酯——上几篇指南里你已经看到了这些呼应。核酸是第三大生物聚合物，而令人安心的消息是：它根本没有藏着任何新化学。把 DNA 拆开，你找到的全部原料，都是你早已见过的官能团工具箱：一个充当碱基的芳香杂环、一个五碳糖、一个磷酸酯。全部的巧妙之处，仅仅在于这三样东西是怎么卡接到一起、再串成一条链的。

我们先把术语钉死，因为这些名字一开始把每个人都绕晕过。核苷就是碱基连上糖——两块。核苷酸是核苷再加上一个或多个磷酸基团栓在糖上——三种零件。核苷酸是单体，是那块单独的乐高积木；核酸则是成千上万块这样的积木连成的一条长聚合物。所以整门课题就是：那三块零件是什么，是什么键把一块积木内部固定住，又是什么键把一块积木连到下一块？

碱基：负责传话的芳香环

信息就住在碱基里，而它们是平展、富含氮的芳香环——是你在芳香篇里见过的吡啶和吡咯杂环的直系亲属。它们有两种形状。嘧啶类（胞嘧啶、胸腺嘧啶、尿嘧啶）是一个带两个氮的六元单环。嘌呤类（腺嘌呤、鸟嘌呤）更大：一个六元环并合一个五元环，总共四个氮。两者都是货真价实的芳香性——平展、完全共轭、带着恰好 4n+2 个离域的 π 电子——这正是它们在化学上耐受、平面、并能像硬币一样堆叠的原因。

凑近看每个环的边缘，你就会找到日后负责碱基配对的那些官能团：环上的 N-H 键、羰基 C=O，以及氨基 -NH2，全都朝外指着。这里有一处值得弄准的细节。芳香环上的一个羰基，原则上可以以 C=O（酮式）存在，也可以以芳香 -OH（烯醇式）存在；同样，氨基可以是 -NH2，也可以是 =NH。对每一个碱基而言，大自然采用的形态——也是压倒性地实际存在的那一个——是酮式/氨基式，而非烯醇式/亚氨式。这个选择并非随意：正是它呈现出正确的氢键给体与受体图案。这就是羰基篇里那套酮-烯醇逻辑，如今正悄悄决定着遗传密码读得对不对。

糖，与糖苷键

碱基并不是自由飘着的；它骑在一个五碳糖上，那是一种叫核糖（在 RNA 里）或 2-脱氧核糖（在 DNA 里）的单糖。这个糖处于它的环形式——而你应当记得，那个环是一个环状半缩醛：链上的醛被它自己的一个羟基在分子内捕获，留下一个特殊的端基碳（C1'），它同时带着一个 -OH 和那个环氧。那个端基碳就是反应的把手，正如在糖类指南里糖与糖形成糖苷键时一样。

要把碱基接上去，糖的端基 -OH 就被碱基的一个氮所取代。结果就是一个 N-糖苷键——和普通糖苷键一样，是形成缩醛的同一步，只不过进来的亲核试剂是一个环上的氮，而不是另一个糖的氧。从机理上看，端基 -OH 离去（它是个半缩醛，所以这个位置很容易形成一个稳定化的正离子），碱基的氮进攻 C1'，于是你就通过一根 C-N 键把碱基锁在了糖上。这根键在 DNA 里很牢固，恰恰因为它是一个完整的缩醛型连接，而非游离的半缩醛——端基碳如今两侧都被封住，再也无法打开回到那个活泼的醛。

那唯一缺失的氧——核糖在 2' 位带一个 -OH，而脱氧核糖那里只是一个 -H——就是 RNA 与 DNA 之间全部的化学差异，而它的后果之大超乎比例。RNA 的 2'-OH 是一个内建的亲核试剂，就坐在主链的旁边；它能转过身去进攻邻近的磷酸，把链切断。DNA 缺了那个羟基，就没有这样一个内部的破坏者，因此稳定得多。一个诚实的结论：“脱氧”不是一条次要的脚注——它恰恰就是为什么是 DNA、而不是 RNA，成了基因组的长期档案库。

磷酸二酯主链

现在我们把积木串起来，而磷酸正是在这里发挥它的价值。磷酸 H3PO4 有三个 -OH，所以它最多能形成三个酯键。在主链里，它恰好形成两个：一个酯连到一个糖的 3'-OH，第二个酯连到下一个糖的 5'-OH。一个磷酸通过两个酯键桥接两个醇，就叫一个磷酸二酯（“二” = 两个酯）。把它们一个接一个连下去——糖、磷酸、糖、磷酸——你就搭出了那条贯穿整个分子全长的连续主链。

one strand, read 5' -> 3':

   5'-end
     |
   [sugar]--base
     |  (3')
     O
     |
  -O-P=O          <- phosphodiester:
     |               TWO ester C-O-P bonds,
     O               ONE -O- left over, carrying
     |  (5')         a negative charge at body pH
   [sugar]--base
     |  (3')
     O
     |
  -O-P=O
     |
   ...continues...
     |
   3'-end

  third -OH of each phosphate stays free and ionized: -O(-)

重复的糖-磷酸主链。每个磷酸用它三个 -OH 中的两个去形成酯键（连到一个糖的 3' 和下一个糖的 5'）；第三个保持为电离的 -O-，赋予主链整体的负电荷。这条链是有方向的：一端是游离的 5'-磷酸，另一端是游离的 3'-OH。

这个设计带出三条诚实的后果。第一，每个磷酸上剩下的那个 -OH 是酸性的（第一个质子的 pKa 接近 1-2），所以在细胞内部的 pH 下它是去质子化的——主链每个核苷酸带一个负电荷。这正是为什么这些分子被称为核“酸”，也是为什么整条链是一个聚阴离子，会自我排斥，从而需要反离子和蛋白质来帮它折叠。第二，这条链有真正的方向：一端以游离的 5'-磷酸收尾，另一端以游离的 3'-OH 收尾，而生物学总是从 5' 向 3' 去读、去建。第三——这就是那层家族相似——每形成一个连接都要排出一分子水，所以核酸和蛋白质一样，是一种缩聚物。

碱基配对：靠氢键握住的信息

我们有了一条链。双螺旋则是两条链面对面地握在一起，而那胶水是整个分子里最弱的力：氢键。回想那条规则——一个氢键需要一个给体（连在 N 或 O 上的 H）和一个受体（N 或 O 上的一对孤对电子）。碱基的边缘上恰恰镶满了这些：N-H 和 -NH2 是给体，C=O 和环氮上的孤对电子是受体。当两个碱基的给体与受体互补地对齐时，它们就配对了，就像一把钥匙跨过两链之间的缝隙正好插进一把锁。

先看尺寸。一个嘌呤（大，双环）总是和一个嘧啶（小，单环）配对。两个嘌呤会太胖塞不进缝隙，两个嘧啶又太瘦，所以只有大配小才能让每一格都一样宽——正是这个几何让螺旋保持平顺。
再看图案。在大-小的各种可能里，只有 A 配 T、G 配 C 才真正让给体对上受体。A 和 T 呈现一个匹配的两键图案；G 和 C 呈现一个匹配的三键图案。错误的配对会把给体对上给体——那是顶撞，而非紧扣。
数一数键。A=T 由两个氢键握住；G≡C 由三个。所以一段富含 G 和 C 的 DNA 被粘得更紧，需要更多的热才能拉开——这是一个真实、可测量的差别，不是比喻。

不过对“是什么让螺旋握得住”要诚实，因为氢键只是故事的一部分。每一个氢键单独看都很弱——只有真正共价键的百分之几——单凭一个，根本敌不过水分子的推搡。有两样东西救了它。第一，它们成千上万地排成一列，许多个弱握加起来就成了一个牢固的握（这和让壁虎挂在玻璃上的协同逻辑是一样的）。第二，也许更重要：平展的芳香碱基像一卷硬币那样一个叠一个，而这种碱基堆叠——范德华接触与 π 体系交叠的混合——贡献了真实稳定性的很大一部分。氢键负责挑出正确的搭档；堆叠和那纯粹的数量，才让结构经久。

为什么这个设计行得通

退后一步，这个分子的精妙就在于强键与弱键之间的分工。主链由强的共价磷酸二酯键握住——碱基的序列，也就是真正的信息，是用不可擦的墨水写就的，不会自己散架。两条链彼此之间，则只靠弱的、可逆的氢键握着。这恰恰是你想要的：要复制或读取信息，你必须短暂地把两条链拉开拉链，而一种弱的、可逆的胶水，能让一个酶把它们剥开再重新封好，却从不切断那条永久的主链。强键负责储存；弱键让你能读取。

而互补配对，正是使复制成为可能的那个机关。因为 A 只配 T、G 只配 C，每条链都是另一条的完美底片：知道一条序列，你就能一个字母一个字母地推出另一条。要复制，细胞就把螺旋拉开，让每条旧链充当模板，靠碱基配对把游离的核苷酸排好队，再缝合它们的磷酸二酯主链——正是上一节那套缩合化学，如今由一个酶来跑。你整条阶梯一路学来的化学，归根结底，就是一个细胞如何记住它自己是什么。

把几条诚实的提醒带着往下走。碱基是芳香杂环，不是随便什么环——它们的平整，以及它们固定的酮式/氨基式互变异构体，正是可靠配对得以成立的前提；一个翻成错误互变异构体的碱基会错配，从而造成突变。氢键按设计就是弱的、可逆的，而且它们并非独自工作——碱基堆叠承担了很大一部分负荷。而那个区分 RNA 与 DNA 的单独的 -OH，不是一条脚注，而是为什么一种分子归档基因组、另一种则是可弃用的工作副本的根本原因。把这些握住，你理解的核酸就是作为化学的核酸，而不只是一张生物课本里的示意图。