用分子写成的生命
每一个生命体——水洼里的一只细菌、你窗外的那棵橡树、还有你自己——归根结底都是一大群在水中相互碰撞的分子。[[molecular-biology|分子生物学]]研究的正是这一尺度上的生命:不是整个器官,甚至也不是整个细胞,而是那些储存指令、执行化学反应、并把生命从这一代传给下一代的单个分子。这门学科令人惊叹的论断是:一个生命体所做的大部分事情,都可以通过理解少数几种分子以及它们相互作用的规则来理解。
真正挑大梁的只有寥寥几类分子。DNA 是档案库——一段冗长而稳定的文本,保管着所有指令。RNA 是工作副本,也是信使。蛋白质是干活的工人,它们折叠成精确的形状,几乎承担了细胞要做的一切。而看似不起眼的水,则是这一切上演的舞台。你现在开始的这一整级阶梯,正是为了在后续各级深入细节之前,先把这几类分子以及串起它们的几个核心观念介绍清楚。
中心法则:信息的流向
组织起整个领域的那个核心观念,就是[[molbio-central-dogma|中心法则]]:它讲的是生物信息流动的方向。一个基因的信息储存在 DNA 中;在被称为转录的步骤里,它被抄写成 RNA;然后在被称为翻译的步骤里,这段 RNA 被读取出来去合成一个蛋白质。简写就是:DNA -> RNA -> 蛋白质。只要掌握了这一个箭头,分子生物学中几乎其他所有内容都能找到它的位置。
transcription translation DNA -----------------> RNA -----------> protein ^ | | reverse | +----transcription------+ (RNA -> DNA, e.g. retroviruses)
DNA:让遗传成为可能的分子
DNA 为何能如此忠实地储存指令?答案就藏在它的形状里,也就是那著名的[[molbio-dna-double-helix|双螺旋]]。DNA 仅由四种字母——碱基 A、T、G、C——构成,沿着两条链排列。这两条链反向平行,就像两条朝相反方向行驶的车道,一条标着从 5' 到 3',另一条标着从 3' 到 5'。在两链之间的空隙里,字母按照严格的规则配对:A 总是伸过去与 T 相配,G 总是与 C 相配(写作 A-T / G-C)。
5'- A T G C A A G -3'
| | | | | | |
3'- T A C G T T C -5'这种配对是生物学中最深刻的把戏。由于每个碱基都规定了它的搭档,任意一条链都包含了重建另一条链所需的全部信息——于是只要把分子像拉链一样解开,再为每一侧填上对应字母,就能复制它。这正是细胞分裂时一个基因得以忠实传递的方式。但千万别把它想象成一架僵硬的梯子:DNA 是一种动态的、可弯曲、可扭转的分子,蛋白质时刻在抓握、解旋并使它成环。那张干净的示意图只是起点,并非全部真相。
分子生物学从何而来
分子生物学并非凭空出现;它是在三门更古老的学科之间成长起来的,至今仍立足于它们之中。遗传学早在人们知道基因由什么构成之前,就在追问什么会被遗传,并跨越世代追踪各种性状。生物化学则弄清了生命所用的分子及其反应。细胞生物学描绘了细胞内部那些微小的区室。当这些传统相遇、问题变得鲜明而具体时,分子生物学便应运而生:不再只是问性状如何被遗传,而是要问究竟是哪一种分子携带了它们,又究竟是如何携带的。
一段简短而诚实的历史,恰好也是你前路的一张地图。下面的每一个里程碑都对应着这架阶梯上的一级,而且这门学科比你想象的要年轻——它的绝大部分都发生在尚有人亲历的年代里。
- 1953 年——双螺旋。沃森和克里克在罗莎琳·富兰克林的 X 射线图像基础上,提出了 DNA 的结构。一时间,形状解释了功能:这是一种能被复制的分子。
- 1960 年代——破译密码。研究者们弄清了这四种字母是每次读取三个的,以及哪个三联体对应哪种氨基酸——也就是遗传密码本身。
- 1970 年代——重组 DNA。限制酶和载体让生物学家得以在不同生物之间剪切和粘贴基因。重组 DNA把分子生物学变成了一门工程科学。
- 1990 年代至 2003 年——人类基因组计划首次读完了一整套人类基因组,揭示了一个出人意料的事实:我们仅携带约两万个编码蛋白质的基因。
- 2012 年以来——CRISPR-Cas9让在指定位点编辑基因组变得廉价而常规——它威力强大,但正如我们后面会看到的,并非完美精准。
它提出的问题——以及几句诚实的提醒
那么,一位分子生物学家究竟在追问什么?诸如此类的问题:是哪个基因制造了这个蛋白质,它又在什么时候被开启?基因组是如何被无误地复制、又在受损时被修复的?细胞如何选择去读取某些基因、又沉默另一些,从而让 DNA 完全相同的肝细胞和神经元变得如此不同?而在数十亿年的进化中,这些分子又是如何演变的?这架阶梯后面的每一级,都会依次拾起其中的一个问题。
一个不错的开端,是先抛弃几条你或许早已听过的半真半假之说。“一个基因,一种蛋白质”已经过时:通过可变剪接,单个基因可以产出许多种不同的蛋白质。“垃圾 DNA”这个标签贴得太早了——许多非编码 DNA 都在切实地承担着调控工作。而且基因组的大小并不与复杂程度挂钩:某些蕨类和变形虫所拥有的 DNA 远比我们多。更大并不意味着更聪明。