PCR：在试管里复制 DNA

细胞的复制把戏，被借到了试管里

从这级阶梯很靠下的地方，你已经知道细胞如何复制它的 DNA：一种聚合酶读取一条链、造出互补的搭档，让 A 对上 T、G 对上 C。上一级借走了细胞的剪刀和胶水，好让你能*剪切粘贴* DNA。这一篇借走的是它的*复印机*。聚合酶链反应——PCR——把那套同样的「照模板复制」化学从活细胞里取出来，放进一支塑料试管，有意地、一遍又一遍地运行，直到选定的一段 DNA 被复制了十亿倍。它干脆就是分子实验室里用得最多的技术，也正因为它，一根拭子、一根头发、一滴血才能被逼着开口说话。

把这份巧思浓缩成一句话：一轮里造出的拷贝，会成为下一轮的模板，于是拷贝再造拷贝。这正是*链*这个字的含义——一场自我喂养的链式反应。细胞每分裂一次把整个基因组复制一遍，然后停下；PCR 则瞄准一个小小的目标，毫不松懈地复制*那一段*，每个循环都让它翻倍。可要把细胞的复印机从细胞里拽出来，你必须解决两个细胞靠自己那些无法外借的蛋白质来解决的问题：在没有酶的情况下如何把两条链撬开，以及如何告诉聚合酶该复制*哪一段*。PCR 的两样关键配料——热，和一对引物——正是这两个问题的答案。

三个步骤，重复进行：变性、退火、延伸

一个 PCR 循环不过是三个温度，每个各保持几秒钟，在一台叫热循环仪的机器里——它按预定程序给试管加热和降温。第一步，变性：试管被加热到约 95 摄氏度。双螺旋的两条链仅靠氢键拢在一起——弱，但数量众多——所以热把它们摇松，螺旋拉开成两条单链。这正是你认识过的、作为 DNA 一项性质的熔解；在这里它替代了细胞本会动用的解旋酶。热，就是那根分子撬棍。

第二步，退火：试管降温到大约 50 到 65 度。此时那两段实验室合成的短 DNA——叫引物、加入时量极大——会在单链上找到各自匹配的序列，靠碱基配对（A-T、G-C）贴上去。降温让配对得以发生；但因为微小的引物到处都是，而原本那条长链稀少，链抓住一条引物，要比它重新找到对方快得多。第三步，延伸：试管升温到约 72 度——聚合酶最喜欢的工作温度——酶落到每个上了引物的位点，沿模板复制下去，按 5' 到 3' 的方向逐个添加核苷酸。一轮变性、退火、延伸下来，每一条原本的目标链都已变成一条崭新的双链。

变性（约 95 C）。热把氢键打断，将每个双螺旋拉开成两条单链模板——不需要解旋酶。
退火（约 50-65 C）。降温，让两条引物在目标两端各自匹配的位置上碱基配对，每条链上一条——这一步给反应瞄准。
延伸（约 72 C）。耐热的聚合酶抓住每条引物的 3' 端，沿模板复制下去，造出一条新的互补链。
重复 25-40 次。每个循环的产物成为下个循环的模板，于是目标每一轮大致翻倍。

翻倍，再翻倍：指数增长

现在再跑一遍这个循环。第一个循环造出的每条链，都是第二个循环的模板；第二个循环的两个产物，又都是第三个循环的模板。目标拷贝数每个循环大致翻倍，于是它像 1、2、4、8、16、32…… 这样增长——是几何式的，不是匀速的。n 个循环之后，你大约有 2 的 n 次方份拷贝。这些数字令人吃惊：10 个循环约一千倍，20 个循环约一百万倍，30 个循环约十亿倍。这就是为什么一个微弱到根本测不到的单个目标分子，在循环仪里跑一个下午后，会变成一座看得见、用得上的同样 DNA 之山。指数增长，正是热循环的整台引擎。

one PCR cycle = three temperatures:

  DENATURE  ~95C   ===||===   ->   ===   +   ===   (strands part)
  ANNEAL    ~55C   ===>            <===            (primers stick to ends)
  EXTEND    ~72C   ===>------>     <------<===     (polymerase copies)

repeat -> copies become templates -> exponential doubling:

  cycle:   0     1     2     3   ...   10      20        30
  copies:  1     2     4     8   ...  ~1e3    ~1e6     ~1e9
           (after n cycles: about 2^n copies of the target)

每个循环的新链都是下个循环的模板，于是目标像 2 的 n 次方那样增长：到第 10 个循环约一千倍，到第 30 个约十亿倍。

一个诚实的小皱褶：翻倍从来不是完美高效的，也不可能永远进行下去。每个循环复制的，略少于现有模板的 100%；而当反应耗尽引物和核苷酸——并且当试管里挤满了如此多的产物链、以致它们彼此重新配对快过引物结合时——曲线就平缓下来，进入平台期。所以 PCR 给你的并非字面意义上的 2 的 n 次方；它给你的是起初的指数增长、临近末尾时趋于平缓。这个细节看着像个脚注，但它对*测量* DNA 关系极大，而那正是通往下一个想法的门。

引物即准星——也是那两位主角

PCR 为什么只复制整个基因组里选定的那一段，而不是全部 DNA？答案是那一对引物，而它值得被理解，而非死记。引物是一小段单链 DNA，约长 18 到 25 个字母，由你设计、订购，使之与你目标的某一端互补。一次反应用两条：一条*正向*引物匹配目标在一条链上的起始端，一条*反向*引物匹配另一条链上的另一端——它们面朝里，像两个书签，恰好夹住你想要的那段文字。聚合酶只能从每条引物*向前*延伸、伸进它们之间的区域，所以只有位于两个引物位点之间的 DNA 才会被复制。换掉这两条引物，你就把同一台机器对准了另一个基因。引物*就是*那个地址。

第二位主角是那种酶。普通的 DNA 聚合酶在第一次 95 度变性步骤里就会被烫死，而早期的 PCR 确实需要每一个循环都人工补加新酶。解决之道来自一个出人意料的地方：一种细菌，*水生栖热菌（Thermus aquaticus）*，它生活在接近沸腾的温泉里。它的聚合酶，[[taq-polymerase|Taq]]，在那样的温度下仍保持折叠、活跃，所以它挺过每一次变性、一路复制完三十多个循环——加一次，然后走开就行。和你认识过的每种聚合酶一样，Taq 需要从一条引物的 3' 端起步，并且只按 5' 到 3' 方向构建。有一点值得直说：标准 Taq 没有校对功能，因此偶尔会出复制错误；当需要精确序列时，实验室会改用带校对的高保真酶。

它的威力即它的祸患：PCR 会复制任何匹配的 DNA

这里是整篇里最重要的诚实警示，而它直接源自 PCR 的工作方式。反应根本不知道它的模板从何而来。它会忠实地复制试管里*任何*引物能结合的 DNA——包括你从未想让它出现在那里的 DNA。一个杂入的污染 DNA 分子、一片皮屑、一丝别人样品的痕迹，或者最阴险的——几个从上一次 PCR 飘过来的产物分子，都各自可能成为十亿倍扩增的种子。正是那让 PCR 能检出一个目标分子的指数威力，也意味着它能把一个污染分子变成一个强烈、笃定、彻头彻尾虚假的信号。

PCR 为何是主力——以及接下来是什么

PCR 凭着快速、廉价、惊人地多才多艺，挣得了它作为分子实验室主力的位置。同一套平实的三步循环，能从拭子里检出病毒、为犯罪现场的 DNA 做鉴定、诊断单基因病、为克隆准备一个基因，或核查一次编辑是否成功——你每次只需选一套新引物。这个基本想法还会分叉：先让逆转录酶把 RNA 转成 DNA 再喂给它，RT-PCR 就能让你测量基因的*表达*、或检出一种 RNA 病毒。让拷贝逐个循环地实时累积、而不只在末尾看一眼，定量 PCR（qPCR）就把这反应变成了一台*测量*仪器——这正是前面那个平台期细节为何重要，因为诚实的数量都活在早期那段指数相里。

退一步，看看 PCR *没有*解决什么。它能把一段 DNA 复制十亿份——但它无法告诉你那一段里字母的次序。PCR 负责*扩增*；它不负责*读取*。这两者合在一起，正是把生物学变成数据科学的那项发明的两半，恰如这一级所允诺的：把选定的一段 DNA 扩增十亿倍，以及读出那些字母。你已经有了复印机；接下来几篇会把读取器交到你手里。而这两者配合得极美——大多数现代测序，一开始就要用类似 PCR 的复制，先造出足够多的材料来供阅读。