碱基配对、反平行链与方向性

从一个形状，到它的规则

在上一篇指南里，你把双螺旋当作一个物体来认识——两条链绕着共同的轴扭转，糖-磷酸骨架在外侧，碱基则像螺旋梯子的横档一样收拢在中间。那让你知道了 DNA *长什么样*。这一篇要讲的，是让这个形状真正*运转*起来的那寥寥几条安静规则：哪个碱基与哪个配对、是什么把它们拴在一起，以及每条链朝哪个方向。这些规则不是装饰，它们正是这个分子能够被复制、被读取的根本原因。

这些规则背后还有一段动人的侦探故事。在任何人看到双螺旋之前，化学家埃尔温·查戈夫测量了许多物种 DNA 中的四种碱基，注意到一件怪事：A 的含量总是等于 T 的含量，G 的含量总是等于 C 的含量。这些规律——如今称为[[molbio-chargaffs-rules|查戈夫法则]]——是一条藏在明处的线索。直到沃森和克里克意识到碱基是在两条链之间一对一配对的，这些数字才说得通。是结构*解释*了那些数字。

A 配 T，G 配 C

核心就在这里。在双螺旋的中间，四种碱基以一种严格的、像锁一样的方式配对：A 总是伸过去配 T，G 总是配 C。（在 RNA 中，T 被 U 取代，于是 A 的搭档变成了 U。）这就是[[watson-crick-base-pairing|沃森-克里克碱基配对]]，它绝非随意。它来自两个共同起作用的事实：碱基的*大小*，以及它们能提供的氢键的*形状*。

回想核苷酸那一篇：碱基有两种大小——较大的双环嘌呤（A 和 G）与较小的单环嘧啶（C、T 和 U）。要让双螺旋一路保持等宽——既不鼓胀、也不收窄——每一档都必须是一个大碱基加一个小碱基。所以嘌呤总是面对嘧啶。但仅凭这一点，仍然可能出现 A-C 或 G-T；真正禁止这些、并锁定 A-T 与 G-C 的，是每个碱基所提供的氢键的排布方式。A 与 T 给出的供体与受体恰好能排成*两*条氢键；G 与 C 则排成*三*条。错配的组合根本无法让各自的氢键伙伴对上，所以它们装不进去。

一处需要诚实说明的地方：横档之间的氢键并不是把双螺旋拴在一起的*唯一*因素，甚至可能不是主要因素。扁平的碱基还像一卷码得整整齐齐的硬币那样彼此堆叠，这种碱基堆积贡献了大量的稳定性。氢键决定的是配对的*专一性*——它定下*谁*与*谁*配对——而堆积则承担了维持这一摞稳定的大部分工作。两者都重要；如果某本教科书告诉你单凭氢键就把 DNA 拴在一起，那它简化得有点过头了。

每条链都有方向：5′ 端与 3′ 端

现在来看第二条规则，它很容易被忽略，却同样深刻：一条 DNA 链并不对称。它有头也有尾。要明白为什么，回头看看骨架。每条糖-磷酸骨架都是一串由磷酸基团连接起来的糖环，而这种连接是不对称的。磷酸把一个糖的*第 5 号*碳，连到下一个糖的*第 3 号*碳。这些数字指的是糖环上的位置；化学家用一个撇号来标记它们，于是我们读作五撇（5′）与三撇（3′）。

由于每一处连接都以同样的方式从 5′ 走向 3′，整条链便承袭了一个方向。一端剩下一个自由的 5′ 位置（通常带着一个磷酸）；另一端则剩下一个自由的 3′ 位置（带着一个羟基）。这就是[[strand-directionality-5-3|5′ 到 3′ 方向性]]。按照牢固的惯例，我们以 5′ 到 3′ 的方向来读写序列，正如英文从左往右读一样，所以 “5′-ATGC-3′” 与 “3′-CGTA-5′” 描述的，其实是同一条物理链，只是从两端分别写出而已。每当你看到一串没有标注的裸序列，比如 ATGC，就默认它表示 5′-ATGC-3′。

为什么两条链必须反平行

把这两条规则放到一起，第三条规则便自然冒了出来。如果每条链都有方向，那么双螺旋的两条链朝哪个方向？答案是它们朝*相反*的方向：当一条链在页面上自上而下地从 5′ 走向 3′ 时，它的搭档则在旁边从 3′ 走向 5′。这两条链是[[molbio-antiparallel-strands|反平行]]的——可以把它们想象成高速公路上两条朝相反方向行驶的车道，一条车道里的 A 总是伸过去，与另一条车道里的 T 配对。

这并不是可以随意挑选的——是化学迫使它如此。要让一对碱基的氢键在一档之间对上，两条骨架必须从相反的取向去接近这一对碱基。如果你试着把两条链摆成*平行*（都朝同一方向），供体与受体原子就不再对齐，碱基对无法形成氢键，双螺旋也就合不拢。反平行，正是那种能让 A-T 与 G-C 对平整、贴合地夹在两条骨架之间的几何。下面这张小图把整幅画面都画了出来：

5'- A   T   G   C   A   A -3'
    |   |   |   |   |   |       A=T : 2 H-bonds
3'- T   A   C   G   T   T -5'   G=C : 3 H-bonds

read the top strand left-to-right (5'->3'):  A T G C A A
read the bottom strand left-to-right:         T A C G T T   <- runs 3'->5'
the bottom strand, read 5'->3', is:           T T G C A T

两条反平行的链。每一列都是一个由氢键握住的碱基对（A-T 两条，G-C 三条）。知道了一条链，另一条便被完全确定。

互补性：为什么这让 DNA 能被复制、被读取

现在来看回报——上面一切之中最重要的那个后果。由于配对是严格的、两条链又是反平行的，这两条链便是互补的：每一条都携带着重建另一条所需的全部信息。在一条链上凡是看到 A，你就知道它的搭档是 T；凡是看到 G，你就知道它的搭档是 C。第二条链并不是额外的信息——它是第一条链的镜像，以配对规则写成。这种冗余，正是遗传的深层秘密。

沃森和克里克在把结构弄对的那一刻就明白了这一点，并写下了那句著名的话：这种配对“立即暗示了一种可能的复制机制”。这个想法后来成了半保留复制：要复制这个分子，细胞把两条链拉开，分别以每条旧链为模板，一个碱基接一个碱基地拼出一条全新的互补搭档链。让我们一步步走一遍：

细胞打断碱基之间那些较弱的氢键，把两条链拉开，让每条旧链的碱基都裸露出来——共价的骨架完好无损，只是横档被劈开了。
现在每个裸露的碱基都索要它唯一合法的搭档：裸露的 A 召唤一个 T，G 召唤一个 C。配对规则把每条旧链变成了为新搭档而写的、精确的指令书。
一种酶沿着每条旧链以 3′ 到 5′ 的方向读取，并对着它以 5′ 到 3′ 的方向建造新链，于是新搭档最终是反平行的——恰如几何所要求的那样。
结果是两个一模一样的双螺旋，每一个都由一条旧链和一条全新的链组成。信息从未被凭空发明——它只是从一条互补的模板上被读取了出来。

读取、检测，以及两点诚实的提醒

正是同一种互补性，让 DNA 不仅可被复制，更可被*读取*。当一个基因被转录时，细胞把双螺旋打开，以其中一条链为模板，造出一份互补的 RNA 副本——遵循的是同一套碱基配对逻辑，只是用 U 顶替了 T。互补性在实验室里也是主力：一条短短的单链能从数百万条的“汤”里找到并结合上它的互补链，这个本领叫做杂交，是 DNA 探针、芯片以及 PCR 中引物的基础。一条安静的规则——A 配 T、G 配 C，在反平行的链上——结果竟同时驱动了复制、读取与检测。

带着两点诚实的提醒继续往上走。其一，配对虽严格却并非毫无差错：偶尔会有一个错误的碱基溜进来，这正是突变的来源之一——我们会在往上两级的阶梯上正式讨论它，到那时你会看到，这类改变大多无害，而恰恰是这种不完美，构成了演化的原材料。其二，不要把 DNA 想成一架僵硬的梯子。它是一个动态的、可弯折的分子，会扭动、会在局部“呼吸”着张开、会紧紧缠绕在蛋白质上；那些干净的示意图只是一张快照，并非全部真相。把这两点提醒记在心里，本篇里的规则就会一路忠实地为你服务，直到阶梯的顶端。