复制发生在哪里
在上一篇指南里,你看到了 DNA *是*以半保留方式被复制的——每条旧链都成为合成新伙伴的模板——也看到了梅塞尔森和斯塔尔如何仅凭一台离心机和两种氮,就把这件事证明了。那告诉了你这笔账:每条子代螺旋等于一条旧链加一条新链。但它没告诉你,在这条长长的分子里,复制究竟从*哪里*开始,也没告诉你细胞*如何*把一条缠得紧紧的双螺旋实实在在地拉开,并为每一侧写出一份忠实的副本。这正是本篇要讲的。
复制并非随便从哪儿都能开始。它从 DNA 中被标记好的特定位点起步,这些位点叫[[molbio-origin-of-replication|复制起点]]——可以把它们看作写在序列里的官方“从这里开始复制”的标志。复制起点是一段特定的 DNA,常富含 A-T 碱基对。为什么是 A-T?回想化学那几级讲过的:A-T 对只靠两个氢键相连,而 G-C 对有三个,所以富含 A-T 的 DNA 是最容易把两条链撬开的地方。起始蛋白识别起点,把一小段区域强行打开,再召来其余的机器。
一旦一小段区域被打开,复制不会只朝一个方向慢慢爬开——它会*同时*向两边铺展,就像从夹克中间某一点把拉链拉开。这个张开的缺口就是复制泡,在它两端各有一个移动的 Y 形交界处,那里“仍闭合”遇上“已张开”。每个交界处就是一个[[molbio-replication-fork|复制叉]],而复制叉正是真正的工地:亲本螺旋在此裂成两条单链,复制也在此完成。在显微镜下,小的复制泡看起来像 DNA 上一只张开的眼睛,因此有时被称为复制眼。
认识复制体
复制 DNA 不是一个孤零零的酶的活儿。在每个复制叉处,完成这项工作所需的全部蛋白质汇集成一个庞大而协调的复合体,沿 DNA 一同移动。这整台分子机器就是[[replisome|复制体]]——可以把它想象成停靠在每个复制叉处的一座移动工厂,以严密编排的同一套动作解旋、加引物、复制并校对。在细菌中,它以每秒数百乃至一千以上个碱基的速度前进。它的组成部分从细菌到人类在大轮廓上是保守的,尽管具体的蛋白有所不同。
在按顺序逐一讲解之前,先按各自的职责认识一下这支队伍会很有帮助。最尖端跑着那个解链者。紧随其后,有蛋白包裹住刚刚裸露出来的单链,使它们无法重新合拢。在复制叉的前方,另有一种酶不断缓解扭转张力。而在交界处,一种酶写下起始物,另一种酶把它延伸成真正的新链。五项工作,五类机器。我们一个一个来看。
打开螺旋,并让它保持张开
在复制叉处的头一项工作,就是把两条链揭开,完成这件事的酶是[[dna-helicase|DNA 解旋酶]]。它通常是一种环状蛋白,常由六个亚基组成,套在两条链中的一条上。它依靠细胞的ATP 能量货币提供动力,沿那条链拉动自己前进,像一个移动的楔子一样在前进中把两条链强行分开——打断配对碱基之间的氢键。它跑在复制叉的最尖端、一路领先,使后方的聚合酶始终有单链模板可读。(要小心区分一点:解旋酶只打断碱基对的氢键,从不切断糖-磷酸骨架。)
但刚被分开的单链就像被揭开的魔术贴:两半总想立刻重新粘回去。若不加干预,解开的单链会重新配对,或折叠回去与自身配对而缠成发夹结构。所以解旋酶一打开螺旋,许多份[[molbio-single-strand-binding-protein|单链结合蛋白]](细菌中称 SSB;真核中对应的是 RPA)就立刻包裹住裸露的单链。它们结合任何单链 DNA 而不论其序列——其职责纯粹是结构性的——让模板保持张开、拉直、不缠绕,直到聚合酶赶到,并保护它免受会咬碎游离单链 DNA 的酶的侵害。
这一切解旋背后还藏着一笔机械账。试着从中间把一条拧得很紧的绳子的两股分开:你手*前方*的那段绳子会越拧越紧,直到你几乎再也拉不动。DNA 正有这个问题——当解旋酶打开螺旋时,复制叉前方仍配对的 DNA 会过度缠绕成超螺旋。缓解这种张力的酶就是[[topoisomerase-gyrase|拓扑异构酶]](在细菌中,有一类叫 DNA 促旋酶)。它们的工作方式是暂时切断骨架——切一条链或两条链都切——让 DNA 绕过或穿过这个切口以释放张力,然后再完美地把它封回去。没有它们,复制叉会在几秒内停摆。
书写新链:先引物,再聚合酶
现在两条链已经张开、被撑分——可复制的核心酶却有个奇怪的局限。[[dna-polymerase-replicative|DNA 聚合酶]]这个构建新链的工人,只能*接续*一条已有的链;它无法从零开始一条新链。这就像一台打印机,可以不断往一摞纸上加页,却无法放下最开头的那一页。所以必须有别的东西先写下最初的几个字母。这就是[[primase-and-rna-primer|引物酶]]的活儿——它是一种特殊的 RNA 聚合酶,*能*在裸露的模板上从头起始。它铺下一小段 RNA——通常约十个核苷酸——与 DNA 互补,这个小小的 RNA 引物便为 DNA 聚合酶提供了它起始所需的游离 3' 端。
fork tip --> [helicase] unzips the helix
|
3'-...T A C G...-5' parent template (read 3'->5')
| primase lays a short RNA starter:
5'- A U G C ... <- RNA primer (note U, not T)
| DNA polymerase extends it 5'->3' in DNA:
5'- A U G C T A G ... primer (RNA) + new DNA strand
topoisomerase works AHEAD; SSB coats the bare strands behind引物就位后,DNA 聚合酶接手,而它遵守两条严格的规则,这两条规则悄悄塑造了复制的一切。第一,它只能把核苷酸加到正在延长的链的 3' 端,所以新链总是沿 5' 到 3' 方向生长(而模板被按 3' 到 5' 方向读取)。第二,它不能起始一条链——它必须延伸一个引物。每走一步,它选出其碱基能与模板正确配对的核苷酸(A 对 T,G 对 C),把它接上去,然后继续前行。许多复制型聚合酶还自带校对功能:一个 3' 到 5' 方向的外切酶,能倒回去剪掉错误的碱基再重试,这正是错误得以稀少到几乎可以忽略的头一个重要原因。(为什么用 *RNA* 引物而不用 DNA?因为用 RNA 可把这些起始序列标记为临时的;它们随后会被移除、缺口用 DNA 填补、接缝被封合——这条线索留待下一篇。)
这支队伍,按顺序
值得把整套流程按它在一个移动复制叉处发生的顺序走一遍。每一步都依赖于前一步,这正是为什么复制体把所有这些机器捆在一起、而不是散落各处的原因。
- 拓扑异构酶/促旋酶在复制叉前方工作,切断并重新封合骨架,把扭转张力卸掉,免得它卡住解旋酶。
- 解旋酶骑在复制叉尖端,打断碱基对的氢键,把亲本螺旋劈成两条单链。
- 单链结合蛋白立刻包裹裸露的单链,使它们无法重新配对或自我折叠。
- 引物酶在暴露的模板上铺下一小段 RNA 引物,提供一个可供延伸的游离 3' 端。
- DNA 聚合酶沿 5' 到 3' 方向延伸引物,逐个加上配对的核苷酸并边走边校对——构建出忠实的新链。
有一处微妙之处值得诚实点出:这幅整齐的“单列纵队”图景是一种简化。两条链反向平行,所以同一个复制叉必须同时用两种不同的方式复制它们——一条顺畅地复制,另一条以倒针缝合般的片段复制——而那两条聚合酶其实被维系在同一个复合体里,那条别扭的链被认为会环出,使两条新链都能在复制叉前进的同一方向上构建。这种不对称,也就是前导链与后随链,正是下一篇的全部主题;在这里,只需记住一点:是同一台机器同时干了这两份活儿。
一个起点还是上千个?规模的问题
最后还有一个极其重要的差别,它直接源自你早先认识过的原核—真核之分。像大肠杆菌这样的细菌只有一条环状染色体,上面只有*一个*起点,叫 oriC。两个复制叉从它出发,沿相反方向绕着这个环飞奔,在另一侧的终止区相遇——整个 460 万碱基对的基因组就此复制完成。对一个小环来说,一个起点绰绰有余。
一个人类细胞则是规模完全不同的难题:约 60 亿碱基对,分布在许多条又长又线性的染色体上,而这一切必须在一个细胞周期阶段的那几个小时内完成复制。如果让单个复制叉从头到尾走完一整条人类染色体,得花上好几个星期。所以真核生物会沿每条染色体点亮*成千上万个*起点,一波波先后启动,复制泡不断长大,相邻的复制叉最终相遇并融合,直到整个基因组复制完成。多起点不是奢侈——它是被纯粹的体量逼出来的必需。
这里有个细微之处要诚实说明:细菌的起点是清晰、定义明确的序列,但在许多真核生物中——尤其哺乳动物——一个起点更多是由其染色质环境、而非严格的 DNA 序列来界定的,每个起点究竟在何处、何时启动,仍是一个活跃的研究问题。但有一点是确凿无疑的,那就是控制逻辑:一个细胞每个周期必须把基因组复制一次且仅一次。每个起点在每个细胞周期里只被“授权”启动一次,而这种授权只在分裂之后才被重置——这是防止任何区段被复制两次的保险。起点的误启动或重复启动会使基因组的某些部分被多复制或少复制,这正是癌症中所见基因组不稳定的标志。