JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

载体与质粒

限制酶把一个基因切下来——可一段裸露的 DNA 碎片丢进细胞,只会烂掉。载体就是那辆把你的基因运进去、让它被复制亿万次、还能帮你找出接收了它的细胞的运输工具。来认识质粒和它三个不可或缺的部件、装更大货物的更大运输工具,以及把克隆基因变成蛋白质的表达载体。

为什么一个切下来的基因需要搭车

上一篇指南里你看着一种限制酶做了一件近乎神奇的事:沿双螺旋扫描,找到一小段回文,在恰好相同的位置把两条链都剪开,留下一段带整齐悬突末端的碎片。假设那段碎片正是你关心的基因——比方说,人的胰岛素基因。你现在把它握在管子里,作为一小段自由漂浮的 DNA。你能拿它做什么?单凭它本身,几乎什么都做不了。它的量太少,少得无法研究,你读不出单个分子,而你一把它放进活细胞,细胞的清理酶就会把它嚼成碎片。一个裸露的基因,是一段无从保存、复制或读取的信息。

解决之道,是别再把基因当成要直接研究的货物,而是把它粘进一段细胞本就懂得保存和复制的 DNA 里。那个载具就是克隆载体——一个被改造成运输工具的、小巧而温顺的 DNA 分子。你把碎片贴进载体,做成一个合二为一的重组DNA分子,把整个东西塞进一个细菌,剩下的交给细菌去做。随着细胞生长分裂,它一遍又一遍地复制载体——连同你的搭车基因一起。一夜之间,你从一个细胞长出亿万个一模一样的细胞,每一个都带着你那基因的完美拷贝。这一句话就道出了克隆的含义:不是造一只羊,而是造出一群都握着同一段选定 DNA 的细胞。

质粒和它三个不可或缺的部件

最得力的载体是质粒:一个小小的双链 DNA 环,通常几千个碱基对上下,住在细菌体内、与主染色体完全分开。质粒不是人类的发明——细菌天生就携带它们,常在上头四处传递抗生素抗性基因。分子生物学家不过借用了这个点子,把环重新搭建一番,剪掉不想要的、添上想要的。一个现代的克隆质粒,是一个被改造过的小环,而几乎每一个都带着同样的三个工作部件。学会这三个,你就掌握了整套工具箱的核心。

第一,复制起点,常写作 *ori*。这是一小段序列,细胞的复制机器把它认作开始复制的地方——正是你在学习染色体如何被复制时见过的那种起点。没有它,质粒就只会呆坐在那儿无所作为,并随细胞分裂被稀释掉。有了它,质粒每一代都由宿主自己的酶来复制,于是它得以留存并增殖。复制起点还悄悄定下了拷贝数:有些起点让每个细胞只保留一两份质粒,另一些则放任它涨到几百份——当目标是尽可能多地收获 DNA 时,你要的正是后者。

第二,选择标记——它回应的是一个残酷的实际难题。当你把质粒和细菌混在一起,真正接收到质粒的细胞只占极小一部分;其余的什么也没拿到。你若只是把混合物铺到培养皿上,接收了你质粒的细胞,会被没接收的细胞淹没得毫无希望,你永远也挑不出来。经典的选择标记,是嵌进质粒里的一个抗生素抗性基因。你把细胞养在掺了那种抗生素的平板上,逻辑就变得致命地简单:任何没有质粒的细胞都没有抗性、会死掉,而每一个活下来的,必定带着你的质粒。毒药替你做了分拣。平板上一片菌落,就是一片你确知正握着你基因的细胞。

第三,多克隆位点,又称多聚接头。这是你基因进场的装货口。它是一小段精心设计的 DNA,密集排布着许多种不同限制酶的识别位点,每一种在整个质粒里都*只出现一次*。这种唯一性正是关键所在。用其中一种酶切质粒,它就只在一处打开——那个克隆位点——环的其余部分纹丝不动,留下的悬突末端恰与你插入片段的末端相配。你的碎片与开了口的质粒,如今有了互补的黏性末端,于是它们靠碱基配对啪地接上,再由一种 DNA 连接酶把接口封成一个连续的环。质粒,实际上就是一个现成的插槽,等着任何你能切来合身的基因。

载体如何把一段碎片变成可以养起来的东西

看这三个部件在一次操作里如何协同。结果便是重组 DNA 的核心把戏:一段单凭自己毫无用处的碎片,变成了一窝活着、长着、可收获的、彼此相同的菌落。请注意,这里没有任何一步需要古怪的化学——限制酶来切,连接酶来接,细菌负责复制和生长。你做的大多只是挑对零件,然后让生物学自己运转。

  1. 都切开。用一种限制酶在克隆位点处剖开质粒,并用同一种酶把你的基因从源 DNA 里切出来,于是两块都带上相配的黏性末端。
  2. 把它们接起来。把开口的质粒和你的碎片混在一起;互补的悬突彼此配对,DNA 连接酶封住骨架,造出一个带着你基因的重组环。
  3. 把它送进细胞。在能让细胞短暂吸入 DNA 的条件下,把这些环与细菌混合——这种吸收称为转化。只有少数细胞会成功。
  4. 做选择。把细胞铺到含有抗生素的平板上。只有携带质粒(及其抗性标记)的细胞能存活,于是每一个长出的菌落都握着你的基因。
  5. 扩大培养并收获。挑一个菌落,过夜养成亿万个细胞,每个细胞在分裂时都复制质粒。把细胞胀破,你便回收到大量纯净的你的基因。

更大的货物需要更大的运输工具

质粒很美妙,但有装载上限。插入片段一旦超过大约一万五千个碱基对,质粒就变得不稳定——它复制得很差,细胞也倾向于把它吐出来。装一个基因这没问题,可一个连带全部内含子的人类基因、或是你想研究的一整段染色体区域,都可能大得塞不进去。于是人们造出了一族大容量载体,每一种都拿一些便利去换携带更大乘客的能力。它们共通的诀窍是一样的:借用一套本就在四处搬运大段 DNA 的天然系统,再把它重塑成一辆运输工具。

往上的第一步借用了一种病毒。噬菌体是感染细菌的病毒,研究得很透的 λ 噬菌体自带一个蛋白质外壳,能高效地把它的 DNA 注射进细胞。把噬菌体自己的中段挖掉,你就能塞进约两万个碱基对的外源 DNA,再让噬菌体去打包并投递——这比哄着细菌去吞下裸质粒高效得多。把这个点子再往前推,你就得到柯斯质粒,一种巧妙的杂交体:它保留了噬菌体的打包信号,但一旦进入细胞,其余表现就像个质粒,能携带多达约四万五千个碱基对。这架阶梯每上一级,都为货物买来更多空间。

对于基因组计划所需要的那种真正庞大的插入片段,有两个巨人顶起了上限。BAC——细菌人工染色体——是用一种天然细菌质粒造的,它每个细胞只复制一两份,正好让哪怕巨大的插入片段也保持稳定;一个 BAC 通常携带几十万个碱基对,BAC 正是人类基因组计划的中坚。更大的是 YAC——酵母人工染色体——它根本不在细菌里养,而是在酵母里,由一条真染色体最起码的几样必需件拼成:一个复制起点、一个着丝粒(好让它在细胞分裂时被正确地拉过去),以及给两端封口的端粒。一个 YAC 能装下一百万个碱基对甚至更多,尽管它更难伺候、也更容易把插入片段重排掉。有一条粗略的规律:货物越大,你为携带它而在便利和稳定上让出的就越多。

VECTOR              TYPICAL INSERT SIZE        GROWN IN
-------------------------------------------------------------
plasmid             up to ~15 kb               bacteria
bacteriophage (lambda)  ~9-23 kb               bacteria (phage)
cosmid              ~30-45 kb                  bacteria
BAC                 ~100-300 kb                bacteria
YAC                 ~100 kb - >1,000 kb        yeast

   ( kb = kilobases = thousand base pairs )
   bigger cargo  ->  bigger, fiddlier vehicle
一架按携带 DNA 多少排列的载体粗略阶梯——挑能装下你插入片段的最小载具,因为更大的那些要拿便利和稳定去交换。

从复制一个基因到造出它的蛋白质

到目前为止讲的全是*复制*一个基因——保存它、增殖它、收获纯净的 DNA。但你常常想要更多:基因所编码的那个实实在在的蛋白质,而且要大量地造出来。一个朴素的克隆载体单凭自己做不到这一点。回想这架阶梯早先讲过的中心法则——DNA -> RNA -> 蛋白质。一个基因只有当细胞把它转录、再翻译时,才会变成蛋白质,而这需要基因周围有恰当的信号。细菌不会自动去读你只是停泊在它细胞里的一个人类基因;人类基因自己的那些开关,对细菌的机器来说毫无意义。

答案是表达载体——一种带有额外部件的克隆载体,这些部件把造蛋白质的明确指令交到宿主细胞手上。紧挨克隆位点上游,坐着一个宿主 RNA 聚合酶能识别的强启动子,再加上核糖体起始翻译所需的信号,于是你的基因一放进去,细胞就开足马力地把它转录并翻译。最好的表达载体还把启动子置于一个你能掌控的开关之下——通常是你往培养物里加入的一种小分子——好让细胞先平和地长起来,然后才被告知倾尽精力去大量生产你的蛋白质(这种蛋白质量大时本可能有毒)。这就是重组蛋白表达,如今几乎所有治疗用的胰岛素都是这么造出来的:把人胰岛素基因放进一个表达载体,养在一缸缸分泌人类蛋白质的细菌或酵母里。

两条诚实的提醒,让这事不至于听上去像魔法。第一,细菌读一个基因的方式与人类细胞略有不同——它不能把内含子剪掉,也会略过人类蛋白质折叠与运作所需的许多化学修饰,所以对某些蛋白质,你必须改用酵母、昆虫或哺乳动物细胞作宿主,配上为它们打造的载体。(这也是为什么生物学家常克隆一个基因去掉内含子的 cDNA 版本,而非原始的基因组拷贝——不过那是后面几篇指南的故事。)第二,被高速逼出来的外源蛋白质,可能凝成无用的不溶团块,所以哄出一份折叠良好、有活性的好产量,本身就是一门手艺。表达载体给了你造蛋白质的机器;从中拿到*能用的*蛋白质,才是真正功夫大多仍栖身之处。