从一个形状,到它的规则
在上一篇指南里,你把双螺旋当作一个物体来认识——两条链绕着共同的轴扭转,糖-磷酸骨架在外侧,碱基则像螺旋梯子的横档一样收拢在中间。那让你知道了 DNA *长什么样*。这一篇要讲的,是让这个形状真正*运转*起来的那寥寥几条安静规则:哪个碱基与哪个配对、是什么把它们拴在一起,以及每条链朝哪个方向。这些规则不是装饰,它们正是这个分子能够被复制、被读取的根本原因。
这些规则背后还有一段动人的侦探故事。在任何人看到双螺旋之前,化学家埃尔温·查戈夫测量了许多物种 DNA 中的四种碱基,注意到一件怪事:A 的含量总是等于 T 的含量,G 的含量总是等于 C 的含量。这些规律——如今称为[[molbio-chargaffs-rules|查戈夫法则]]——是一条藏在明处的线索。直到沃森和克里克意识到碱基是在两条链之间一对一配对的,这些数字才说得通。是结构*解释*了那些数字。
A 配 T,G 配 C
核心就在这里。在双螺旋的中间,四种碱基以一种严格的、像锁一样的方式配对:A 总是伸过去配 T,G 总是配 C。(在 RNA 中,T 被 U 取代,于是 A 的搭档变成了 U。)这就是[[watson-crick-base-pairing|沃森-克里克碱基配对]],它绝非随意。它来自两个共同起作用的事实:碱基的*大小*,以及它们能提供的氢键的*形状*。
回想核苷酸那一篇:碱基有两种大小——较大的双环嘌呤(A 和 G)与较小的单环嘧啶(C、T 和 U)。要让双螺旋一路保持等宽——既不鼓胀、也不收窄——每一档都必须是一个大碱基加一个小碱基。所以嘌呤总是面对嘧啶。但仅凭这一点,仍然可能出现 A-C 或 G-T;真正禁止这些、并锁定 A-T 与 G-C 的,是每个碱基所提供的氢键的排布方式。A 与 T 给出的供体与受体恰好能排成*两*条氢键;G 与 C 则排成*三*条。错配的组合根本无法让各自的氢键伙伴对上,所以它们装不进去。
一处需要诚实说明的地方:横档之间的氢键并不是把双螺旋拴在一起的*唯一*因素,甚至可能不是主要因素。扁平的碱基还像一卷码得整整齐齐的硬币那样彼此堆叠,这种碱基堆积贡献了大量的稳定性。氢键决定的是配对的*专一性*——它定下*谁*与*谁*配对——而堆积则承担了维持这一摞稳定的大部分工作。两者都重要;如果某本教科书告诉你单凭氢键就把 DNA 拴在一起,那它简化得有点过头了。
每条链都有方向:5′ 端与 3′ 端
现在来看第二条规则,它很容易被忽略,却同样深刻:一条 DNA 链并不对称。它有头也有尾。要明白为什么,回头看看骨架。每条糖-磷酸骨架都是一串由磷酸基团连接起来的糖环,而这种连接是不对称的。磷酸把一个糖的*第 5 号*碳,连到下一个糖的*第 3 号*碳。这些数字指的是糖环上的位置;化学家用一个撇号来标记它们,于是我们读作五撇(5′)与三撇(3′)。
由于每一处连接都以同样的方式从 5′ 走向 3′,整条链便承袭了一个方向。一端剩下一个自由的 5′ 位置(通常带着一个磷酸);另一端则剩下一个自由的 3′ 位置(带着一个羟基)。这就是[[strand-directionality-5-3|5′ 到 3′ 方向性]]。按照牢固的惯例,我们以 5′ 到 3′ 的方向来读写序列,正如英文从左往右读一样,所以 “5′-ATGC-3′” 与 “3′-CGTA-5′” 描述的,其实是同一条物理链,只是从两端分别写出而已。每当你看到一串没有标注的裸序列,比如 ATGC,就默认它表示 5′-ATGC-3′。
为什么两条链必须反平行
把这两条规则放到一起,第三条规则便自然冒了出来。如果每条链都有方向,那么双螺旋的两条链朝哪个方向?答案是它们朝*相反*的方向:当一条链在页面上自上而下地从 5′ 走向 3′ 时,它的搭档则在旁边从 3′ 走向 5′。这两条链是[[molbio-antiparallel-strands|反平行]]的——可以把它们想象成高速公路上两条朝相反方向行驶的车道,一条车道里的 A 总是伸过去,与另一条车道里的 T 配对。
这并不是可以随意挑选的——是化学迫使它如此。要让一对碱基的氢键在一档之间对上,两条骨架必须从相反的取向去接近这一对碱基。如果你试着把两条链摆成*平行*(都朝同一方向),供体与受体原子就不再对齐,碱基对无法形成氢键,双螺旋也就合不拢。反平行,正是那种能让 A-T 与 G-C 对平整、贴合地夹在两条骨架之间的几何。下面这张小图把整幅画面都画了出来:
5'- A T G C A A -3'
| | | | | | A=T : 2 H-bonds
3'- T A C G T T -5' G=C : 3 H-bonds
read the top strand left-to-right (5'->3'): A T G C A A
read the bottom strand left-to-right: T A C G T T <- runs 3'->5'
the bottom strand, read 5'->3', is: T T G C A T互补性:为什么这让 DNA 能被复制、被读取
现在来看回报——上面一切之中最重要的那个后果。由于配对是严格的、两条链又是反平行的,这两条链便是互补的:每一条都携带着重建另一条所需的全部信息。在一条链上凡是看到 A,你就知道它的搭档是 T;凡是看到 G,你就知道它的搭档是 C。第二条链并不是额外的信息——它是第一条链的镜像,以配对规则写成。这种冗余,正是遗传的深层秘密。
沃森和克里克在把结构弄对的那一刻就明白了这一点,并写下了那句著名的话:这种配对“立即暗示了一种可能的复制机制”。这个想法后来成了半保留复制:要复制这个分子,细胞把两条链拉开,分别以每条旧链为模板,一个碱基接一个碱基地拼出一条全新的互补搭档链。让我们一步步走一遍:
- 细胞打断碱基之间那些较弱的氢键,把两条链拉开,让每条旧链的碱基都裸露出来——共价的骨架完好无损,只是横档被劈开了。
- 现在每个裸露的碱基都索要它唯一合法的搭档:裸露的 A 召唤一个 T,G 召唤一个 C。配对规则把每条旧链变成了为新搭档而写的、精确的指令书。
- 一种酶沿着每条旧链以 3′ 到 5′ 的方向读取,并对着它以 5′ 到 3′ 的方向建造新链,于是新搭档最终是反平行的——恰如几何所要求的那样。
- 结果是两个一模一样的双螺旋,每一个都由一条旧链和一条全新的链组成。信息从未被凭空发明——它只是从一条互补的模板上被读取了出来。
读取、检测,以及两点诚实的提醒
正是同一种互补性,让 DNA 不仅可被复制,更可被*读取*。当一个基因被转录时,细胞把双螺旋打开,以其中一条链为模板,造出一份互补的 RNA 副本——遵循的是同一套碱基配对逻辑,只是用 U 顶替了 T。互补性在实验室里也是主力:一条短短的单链能从数百万条的“汤”里找到并结合上它的互补链,这个本领叫做杂交,是 DNA 探针、芯片以及 PCR 中引物的基础。一条安静的规则——A 配 T、G 配 C,在反平行的链上——结果竟同时驱动了复制、读取与检测。
带着两点诚实的提醒继续往上走。其一,配对虽严格却并非毫无差错:偶尔会有一个错误的碱基溜进来,这正是突变的来源之一——我们会在往上两级的阶梯上正式讨论它,到那时你会看到,这类改变大多无害,而恰恰是这种不完美,构成了演化的原材料。其二,不要把 DNA 想成一架僵硬的梯子。它是一个动态的、可弯折的分子,会扭动、会在局部“呼吸”着张开、会紧紧缠绕在蛋白质上;那些干净的示意图只是一张快照,并非全部真相。把这两点提醒记在心里,本篇里的规则就会一路忠实地为你服务,直到阶梯的顶端。