JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

PCR:在试管里复制 DNA

一段微弱的 DNA,如何在两小时里变成十亿份干净的拷贝——还不需要任何细胞。加热、降温、复制;如此循环;看着一个目标翻倍、再翻倍、又翻倍。

细胞的复制把戏,被借到了试管里

从这级阶梯很靠下的地方,你已经知道细胞如何复制它的 DNA:一种聚合酶读取一条链、造出互补的搭档,让 A 对上 T、G 对上 C。上一级借走了细胞的剪刀和胶水,好让你能*剪切粘贴* DNA。这一篇借走的是它的*复印机*。聚合酶链反应——PCR——把那套同样的「照模板复制」化学从活细胞里取出来,放进一支塑料试管,有意地、一遍又一遍地运行,直到选定的一段 DNA 被复制了十亿倍。它干脆就是分子实验室里用得最多的技术,也正因为它,一根拭子、一根头发、一滴血才能被逼着开口说话。

把这份巧思浓缩成一句话:一轮里造出的拷贝,会成为下一轮的模板,于是拷贝再造拷贝。这正是*链*这个字的含义——一场自我喂养的链式反应。细胞每分裂一次把整个基因组复制一遍,然后停下;PCR 则瞄准一个小小的目标,毫不松懈地复制*那一段*,每个循环都让它翻倍。可要把细胞的复印机从细胞里拽出来,你必须解决两个细胞靠自己那些无法外借的蛋白质来解决的问题:在没有酶的情况下如何把两条链撬开,以及如何告诉聚合酶该复制*哪一段*。PCR 的两样关键配料——热,和一对引物——正是这两个问题的答案。

三个步骤,重复进行:变性、退火、延伸

一个 PCR 循环不过是三个温度,每个各保持几秒钟,在一台叫热循环仪的机器里——它按预定程序给试管加热和降温。第一步,变性:试管被加热到约 95 摄氏度。双螺旋的两条链仅靠氢键拢在一起——弱,但数量众多——所以热把它们摇松,螺旋拉开成两条单链。这正是你认识过的、作为 DNA 一项性质的熔解;在这里它替代了细胞本会动用的解旋酶。热,就是那根分子撬棍。

第二步,退火:试管降温到大约 50 到 65 度。此时那两段实验室合成的短 DNA——叫引物、加入时量极大——会在单链上找到各自匹配的序列,靠碱基配对(A-T、G-C)贴上去。降温让配对得以发生;但因为微小的引物到处都是,而原本那条长链稀少,链抓住一条引物,要比它重新找到对方快得多。第三步,延伸:试管升温到约 72 度——聚合酶最喜欢的工作温度——酶落到每个上了引物的位点,沿模板复制下去,按 5' 到 3' 的方向逐个添加核苷酸。一轮变性、退火、延伸下来,每一条原本的目标链都已变成一条崭新的双链。

  1. 变性(约 95 C)。热把氢键打断,将每个双螺旋拉开成两条单链模板——不需要解旋酶。
  2. 退火(约 50-65 C)。降温,让两条引物在目标两端各自匹配的位置上碱基配对,每条链上一条——这一步给反应瞄准。
  3. 延伸(约 72 C)。耐热的聚合酶抓住每条引物的 3' 端,沿模板复制下去,造出一条新的互补链。
  4. 重复 25-40 次。每个循环的产物成为下个循环的模板,于是目标每一轮大致翻倍。

翻倍,再翻倍:指数增长

现在再跑一遍这个循环。第一个循环造出的每条链,都是第二个循环的模板;第二个循环的两个产物,又都是第三个循环的模板。目标拷贝数每个循环大致翻倍,于是它像 1、2、4、8、16、32…… 这样增长——是几何式的,不是匀速的。n 个循环之后,你大约有 2 的 n 次方份拷贝。这些数字令人吃惊:10 个循环约一千倍,20 个循环约一百万倍,30 个循环约十亿倍。这就是为什么一个微弱到根本测不到的单个目标分子,在循环仪里跑一个下午后,会变成一座看得见、用得上的同样 DNA 之山。指数增长,正是热循环的整台引擎。

one PCR cycle = three temperatures:

  DENATURE  ~95C   ===||===   ->   ===   +   ===   (strands part)
  ANNEAL    ~55C   ===>            <===            (primers stick to ends)
  EXTEND    ~72C   ===>------>     <------<===     (polymerase copies)

repeat -> copies become templates -> exponential doubling:

  cycle:   0     1     2     3   ...   10      20        30
  copies:  1     2     4     8   ...  ~1e3    ~1e6     ~1e9
           (after n cycles: about 2^n copies of the target)
每个循环的新链都是下个循环的模板,于是目标像 2 的 n 次方那样增长:到第 10 个循环约一千倍,到第 30 个约十亿倍。

一个诚实的小皱褶:翻倍从来不是完美高效的,也不可能永远进行下去。每个循环复制的,略少于现有模板的 100%;而当反应耗尽引物和核苷酸——并且当试管里挤满了如此多的产物链、以致它们彼此重新配对快过引物结合时——曲线就平缓下来,进入平台期。所以 PCR 给你的并非字面意义上的 2 的 n 次方;它给你的是起初的指数增长、临近末尾时趋于平缓。这个细节看着像个脚注,但它对*测量* DNA 关系极大,而那正是通往下一个想法的门。

引物即准星——也是那两位主角

PCR 为什么只复制整个基因组里选定的那一段,而不是全部 DNA?答案是那一对引物,而它值得被理解,而非死记。引物是一小段单链 DNA,约长 18 到 25 个字母,由你设计、订购,使之与你目标的某一端互补。一次反应用两条:一条*正向*引物匹配目标在一条链上的起始端,一条*反向*引物匹配另一条链上的另一端——它们面朝里,像两个书签,恰好夹住你想要的那段文字。聚合酶只能从每条引物*向前*延伸、伸进它们之间的区域,所以只有位于两个引物位点之间的 DNA 才会被复制。换掉这两条引物,你就把同一台机器对准了另一个基因。引物*就是*那个地址。

第二位主角是那种酶。普通的 DNA 聚合酶在第一次 95 度变性步骤里就会被烫死,而早期的 PCR 确实需要每一个循环都人工补加新酶。解决之道来自一个出人意料的地方:一种细菌,*水生栖热菌(Thermus aquaticus)*,它生活在接近沸腾的温泉里。它的聚合酶,[[taq-polymerase|Taq]],在那样的温度下仍保持折叠、活跃,所以它挺过每一次变性、一路复制完三十多个循环——加一次,然后走开就行。和你认识过的每种聚合酶一样,Taq 需要从一条引物的 3' 端起步,并且只按 5' 到 3' 方向构建。有一点值得直说:标准 Taq 没有校对功能,因此偶尔会出复制错误;当需要精确序列时,实验室会改用带校对的高保真酶。

它的威力即它的祸患:PCR 会复制任何匹配的 DNA

这里是整篇里最重要的诚实警示,而它直接源自 PCR 的工作方式。反应根本不知道它的模板从何而来。它会忠实地复制试管里*任何*引物能结合的 DNA——包括你从未想让它出现在那里的 DNA。一个杂入的污染 DNA 分子、一片皮屑、一丝别人样品的痕迹,或者最阴险的——几个从上一次 PCR 飘过来的产物分子,都各自可能成为十亿倍扩增的种子。正是那让 PCR 能检出一个目标分子的指数威力,也意味着它能把一个污染分子变成一个强烈、笃定、彻头彻尾虚假的信号。

PCR 为何是主力——以及接下来是什么

PCR 凭着快速、廉价、惊人地多才多艺,挣得了它作为分子实验室主力的位置。同一套平实的三步循环,能从拭子里检出病毒、为犯罪现场的 DNA 做鉴定、诊断单基因病、为克隆准备一个基因,或核查一次编辑是否成功——你每次只需选一套新引物。这个基本想法还会分叉:先让逆转录酶把 RNA 转成 DNA 再喂给它,RT-PCR 就能让你测量基因的*表达*、或检出一种 RNA 病毒。让拷贝逐个循环地实时累积、而不只在末尾看一眼,定量 PCR(qPCR)就把这反应变成了一台*测量*仪器——这正是前面那个平台期细节为何重要,因为诚实的数量都活在早期那段指数相里。

退一步,看看 PCR *没有*解决什么。它能把一段 DNA 复制十亿份——但它无法告诉你那一段里字母的次序。PCR 负责*扩增*;它不负责*读取*。这两者合在一起,正是把生物学变成数据科学的那项发明的两半,恰如这一级所允诺的:把选定的一段 DNA 扩增十亿倍,以及读出那些字母。你已经有了复印机;接下来几篇会把读取器交到你手里。而这两者配合得极美——大多数现代测序,一开始就要用类似 PCR 的复制,先造出足够多的材料来供阅读。