复制叉及其机器

复制发生在哪里

在上一篇指南里，你看到了 DNA *是*以半保留方式被复制的——每条旧链都成为合成新伙伴的模板——也看到了梅塞尔森和斯塔尔如何仅凭一台离心机和两种氮，就把这件事证明了。那告诉了你这笔账：每条子代螺旋等于一条旧链加一条新链。但它没告诉你，在这条长长的分子里，复制究竟从*哪里*开始，也没告诉你细胞*如何*把一条缠得紧紧的双螺旋实实在在地拉开，并为每一侧写出一份忠实的副本。这正是本篇要讲的。

复制并非随便从哪儿都能开始。它从 DNA 中被标记好的特定位点起步，这些位点叫[[molbio-origin-of-replication|复制起点]]——可以把它们看作写在序列里的官方“从这里开始复制”的标志。复制起点是一段特定的 DNA，常富含 A-T 碱基对。为什么是 A-T？回想化学那几级讲过的：A-T 对只靠两个氢键相连，而 G-C 对有三个，所以富含 A-T 的 DNA 是最容易把两条链撬开的地方。起始蛋白识别起点，把一小段区域强行打开，再召来其余的机器。

一旦一小段区域被打开，复制不会只朝一个方向慢慢爬开——它会*同时*向两边铺展，就像从夹克中间某一点把拉链拉开。这个张开的缺口就是复制泡，在它两端各有一个移动的 Y 形交界处，那里“仍闭合”遇上“已张开”。每个交界处就是一个[[molbio-replication-fork|复制叉]]，而复制叉正是真正的工地：亲本螺旋在此裂成两条单链，复制也在此完成。在显微镜下，小的复制泡看起来像 DNA 上一只张开的眼睛，因此有时被称为复制眼。

认识复制体

复制 DNA 不是一个孤零零的酶的活儿。在每个复制叉处，完成这项工作所需的全部蛋白质汇集成一个庞大而协调的复合体，沿 DNA 一同移动。这整台分子机器就是[[replisome|复制体]]——可以把它想象成停靠在每个复制叉处的一座移动工厂，以严密编排的同一套动作解旋、加引物、复制并校对。在细菌中，它以每秒数百乃至一千以上个碱基的速度前进。它的组成部分从细菌到人类在大轮廓上是保守的，尽管具体的蛋白有所不同。

在按顺序逐一讲解之前，先按各自的职责认识一下这支队伍会很有帮助。最尖端跑着那个解链者。紧随其后，有蛋白包裹住刚刚裸露出来的单链，使它们无法重新合拢。在复制叉的前方，另有一种酶不断缓解扭转张力。而在交界处，一种酶写下起始物，另一种酶把它延伸成真正的新链。五项工作，五类机器。我们一个一个来看。

打开螺旋，并让它保持张开

在复制叉处的头一项工作，就是把两条链揭开，完成这件事的酶是[[dna-helicase|DNA 解旋酶]]。它通常是一种环状蛋白，常由六个亚基组成，套在两条链中的一条上。它依靠细胞的ATP 能量货币提供动力，沿那条链拉动自己前进，像一个移动的楔子一样在前进中把两条链强行分开——打断配对碱基之间的氢键。它跑在复制叉的最尖端、一路领先，使后方的聚合酶始终有单链模板可读。（要小心区分一点：解旋酶只打断碱基对的氢键，从不切断糖-磷酸骨架。）

但刚被分开的单链就像被揭开的魔术贴：两半总想立刻重新粘回去。若不加干预，解开的单链会重新配对，或折叠回去与自身配对而缠成发夹结构。所以解旋酶一打开螺旋，许多份[[molbio-single-strand-binding-protein|单链结合蛋白]]（细菌中称 SSB；真核中对应的是 RPA）就立刻包裹住裸露的单链。它们结合任何单链 DNA 而不论其序列——其职责纯粹是结构性的——让模板保持张开、拉直、不缠绕，直到聚合酶赶到，并保护它免受会咬碎游离单链 DNA 的酶的侵害。

这一切解旋背后还藏着一笔机械账。试着从中间把一条拧得很紧的绳子的两股分开：你手*前方*的那段绳子会越拧越紧，直到你几乎再也拉不动。DNA 正有这个问题——当解旋酶打开螺旋时，复制叉前方仍配对的 DNA 会过度缠绕成超螺旋。缓解这种张力的酶就是[[topoisomerase-gyrase|拓扑异构酶]]（在细菌中，有一类叫 DNA 促旋酶）。它们的工作方式是暂时切断骨架——切一条链或两条链都切——让 DNA 绕过或穿过这个切口以释放张力，然后再完美地把它封回去。没有它们，复制叉会在几秒内停摆。

书写新链：先引物，再聚合酶

现在两条链已经张开、被撑分——可复制的核心酶却有个奇怪的局限。[[dna-polymerase-replicative|DNA 聚合酶]]这个构建新链的工人，只能*接续*一条已有的链；它无法从零开始一条新链。这就像一台打印机，可以不断往一摞纸上加页，却无法放下最开头的那一页。所以必须有别的东西先写下最初的几个字母。这就是[[primase-and-rna-primer|引物酶]]的活儿——它是一种特殊的 RNA 聚合酶，*能*在裸露的模板上从头起始。它铺下一小段 RNA——通常约十个核苷酸——与 DNA 互补，这个小小的 RNA 引物便为 DNA 聚合酶提供了它起始所需的游离 3' 端。

fork tip --> [helicase] unzips the helix
              |
   3'-...T A C G...-5'   parent template (read 3'->5')
              |  primase lays a short RNA starter:
   5'- A U G C ...        <- RNA primer (note U, not T)
              |  DNA polymerase extends it 5'->3' in DNA:
   5'- A U G C T A G ...   primer (RNA) + new DNA strand

  topoisomerase works AHEAD; SSB coats the bare strands behind

引物酶写下一小段 RNA 起始物；DNA 聚合酶沿 5' 到 3' 方向延伸它。

引物就位后，DNA 聚合酶接手，而它遵守两条严格的规则，这两条规则悄悄塑造了复制的一切。第一，它只能把核苷酸加到正在延长的链的 3' 端，所以新链总是沿 5' 到 3' 方向生长（而模板被按 3' 到 5' 方向读取）。第二，它不能起始一条链——它必须延伸一个引物。每走一步，它选出其碱基能与模板正确配对的核苷酸（A 对 T，G 对 C），把它接上去，然后继续前行。许多复制型聚合酶还自带校对功能：一个 3' 到 5' 方向的外切酶，能倒回去剪掉错误的碱基再重试，这正是错误得以稀少到几乎可以忽略的头一个重要原因。（为什么用 *RNA* 引物而不用 DNA？因为用 RNA 可把这些起始序列标记为临时的；它们随后会被移除、缺口用 DNA 填补、接缝被封合——这条线索留待下一篇。）

这支队伍，按顺序

值得把整套流程按它在一个移动复制叉处发生的顺序走一遍。每一步都依赖于前一步，这正是为什么复制体把所有这些机器捆在一起、而不是散落各处的原因。

拓扑异构酶／促旋酶在复制叉前方工作，切断并重新封合骨架，把扭转张力卸掉，免得它卡住解旋酶。
解旋酶骑在复制叉尖端，打断碱基对的氢键，把亲本螺旋劈成两条单链。
单链结合蛋白立刻包裹裸露的单链，使它们无法重新配对或自我折叠。
引物酶在暴露的模板上铺下一小段 RNA 引物，提供一个可供延伸的游离 3' 端。
DNA 聚合酶沿 5' 到 3' 方向延伸引物，逐个加上配对的核苷酸并边走边校对——构建出忠实的新链。

有一处微妙之处值得诚实点出：这幅整齐的“单列纵队”图景是一种简化。两条链反向平行，所以同一个复制叉必须同时用两种不同的方式复制它们——一条顺畅地复制，另一条以倒针缝合般的片段复制——而那两条聚合酶其实被维系在同一个复合体里，那条别扭的链被认为会环出，使两条新链都能在复制叉前进的同一方向上构建。这种不对称，也就是前导链与后随链，正是下一篇的全部主题；在这里，只需记住一点：是同一台机器同时干了这两份活儿。

一个起点还是上千个？规模的问题

最后还有一个极其重要的差别，它直接源自你早先认识过的原核—真核之分。像大肠杆菌这样的细菌只有一条环状染色体，上面只有*一个*起点，叫 oriC。两个复制叉从它出发，沿相反方向绕着这个环飞奔，在另一侧的终止区相遇——整个 460 万碱基对的基因组就此复制完成。对一个小环来说，一个起点绰绰有余。

一个人类细胞则是规模完全不同的难题：约 60 亿碱基对，分布在许多条又长又线性的染色体上，而这一切必须在一个细胞周期阶段的那几个小时内完成复制。如果让单个复制叉从头到尾走完一整条人类染色体，得花上好几个星期。所以真核生物会沿每条染色体点亮*成千上万个*起点，一波波先后启动，复制泡不断长大，相邻的复制叉最终相遇并融合，直到整个基因组复制完成。多起点不是奢侈——它是被纯粹的体量逼出来的必需。

这里有个细微之处要诚实说明：细菌的起点是清晰、定义明确的序列，但在许多真核生物中——尤其哺乳动物——一个起点更多是由其染色质环境、而非严格的 DNA 序列来界定的，每个起点究竟在何处、何时启动，仍是一个活跃的研究问题。但有一点是确凿无疑的，那就是控制逻辑：一个细胞每个周期必须把基因组复制一次且仅一次。每个起点在每个细胞周期里只被“授权”启动一次，而这种授权只在分裂之后才被重置——这是防止任何区段被复制两次的保险。起点的误启动或重复启动会使基因组的某些部分被多复制或少复制，这正是癌症中所见基因组不稳定的标志。