JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

什么是分子生物学?

分子生物学是在分子尺度上研究生命的学科——研究 DNA 中的信息如何被复制、读取,又如何被打开或关闭,从而构建并运转一个生命体。本篇先为你勾勒全局,并画出后续旅程的地图。

用分子写成的生命

每一个生命体——水洼里的一只细菌、你窗外的那棵橡树、还有你自己——归根结底都是一大群在水中相互碰撞的分子。[[molecular-biology|分子生物学]]研究的正是这一尺度上的生命:不是整个器官,甚至也不是整个细胞,而是那些储存指令、执行化学反应、并把生命从这一代传给下一代的单个分子。这门学科令人惊叹的论断是:一个生命体所做的大部分事情,都可以通过理解少数几种分子以及它们相互作用的规则来理解。

真正挑大梁的只有寥寥几类分子。DNA 是档案库——一段冗长而稳定的文本,保管着所有指令。RNA 是工作副本,也是信使。蛋白质是干活的工人,它们折叠成精确的形状,几乎承担了细胞要做的一切。而看似不起眼的水,则是这一切上演的舞台。你现在开始的这一整级阶梯,正是为了在后续各级深入细节之前,先把这几类分子以及串起它们的几个核心观念介绍清楚。

中心法则:信息的流向

组织起整个领域的那个核心观念,就是[[molbio-central-dogma|中心法则]]:它讲的是生物信息流动的方向。一个基因的信息储存在 DNA 中;在被称为转录的步骤里,它被抄写成 RNA;然后在被称为翻译的步骤里,这段 RNA 被读取出来去合成一个蛋白质。简写就是:DNA -> RNA -> 蛋白质。只要掌握了这一个箭头,分子生物学中几乎其他所有内容都能找到它的位置。

         transcription        translation
  DNA  ----------------->  RNA  ----------->  protein
   ^                       |
   |   reverse             |
   +----transcription------+   (RNA -> DNA, e.g. retroviruses)
中心法则讲的是方向——而那条从 RNA 折返回 DNA 的虚线箭头是被允许的,并未被禁止。

DNA:让遗传成为可能的分子

DNA 为何能如此忠实地储存指令?答案就藏在它的形状里,也就是那著名的[[molbio-dna-double-helix|双螺旋]]。DNA 仅由四种字母——碱基 A、T、G、C——构成,沿着两条链排列。这两条链反向平行,就像两条朝相反方向行驶的车道,一条标着从 5' 到 3',另一条标着从 3' 到 5'。在两链之间的空隙里,字母按照严格的规则配对:A 总是伸过去与 T 相配,G 总是与 C 相配(写作 A-T / G-C)。

  5'- A  T  G  C  A  A  G -3'
      |  |  |  |  |  |  |
  3'- T  A  C  G  T  T  C -5'
两条反向平行的链;上方的每个碱基都决定了下方与之配对的碱基,因此任意一条链都是重建另一条链的配方。

这种配对是生物学中最深刻的把戏。由于每个碱基都规定了它的搭档,任意一条链都包含了重建另一条链所需的全部信息——于是只要把分子像拉链一样解开,再为每一侧填上对应字母,就能复制它。这正是细胞分裂时一个基因得以忠实传递的方式。但千万别把它想象成一架僵硬的梯子:DNA 是一种动态的、可弯曲、可扭转的分子,蛋白质时刻在抓握、解旋并使它成环。那张干净的示意图只是起点,并非全部真相。

分子生物学从何而来

分子生物学并非凭空出现;它是在三门更古老的学科之间成长起来的,至今仍立足于它们之中。遗传学早在人们知道基因由什么构成之前,就在追问什么会被遗传,并跨越世代追踪各种性状。生物化学则弄清了生命所用的分子及其反应。细胞生物学描绘了细胞内部那些微小的区室。当这些传统相遇、问题变得鲜明而具体时,分子生物学便应运而生:不再只是问性状如何被遗传,而是要问究竟是哪一种分子携带了它们,又究竟是如何携带的。

一段简短而诚实的历史,恰好也是你前路的一张地图。下面的每一个里程碑都对应着这架阶梯上的一级,而且这门学科比你想象的要年轻——它的绝大部分都发生在尚有人亲历的年代里。

  1. 1953 年——双螺旋。沃森和克里克在罗莎琳·富兰克林的 X 射线图像基础上,提出了 DNA 的结构。一时间,形状解释了功能:这是一种能被复制的分子。
  2. 1960 年代——破译密码。研究者们弄清了这四种字母是每次读取三个的,以及哪个三联体对应哪种氨基酸——也就是遗传密码本身。
  3. 1970 年代——重组 DNA。限制酶和载体让生物学家得以在不同生物之间剪切和粘贴基因。重组 DNA把分子生物学变成了一门工程科学。
  4. 1990 年代至 2003 年——人类基因组计划首次读完了一整套人类基因组,揭示了一个出人意料的事实:我们仅携带约两万个编码蛋白质的基因。
  5. 2012 年以来——CRISPR-Cas9让在指定位点编辑基因组变得廉价而常规——它威力强大,但正如我们后面会看到的,并非完美精准。

它提出的问题——以及几句诚实的提醒

那么,一位分子生物学家究竟在追问什么?诸如此类的问题:是哪个基因制造了这个蛋白质,它又在什么时候被开启?基因组是如何被无误地复制、又在受损时被修复的?细胞如何选择去读取某些基因、又沉默另一些,从而让 DNA 完全相同的肝细胞和神经元变得如此不同?而在数十亿年的进化中,这些分子又是如何演变的?这架阶梯后面的每一级,都会依次拾起其中的一个问题。

一个不错的开端,是先抛弃几条你或许早已听过的半真半假之说。“一个基因,一种蛋白质”已经过时:通过可变剪接,单个基因可以产出许多种不同的蛋白质。“垃圾 DNA”这个标签贴得太早了——许多非编码 DNA 都在切实地承担着调控工作。而且基因组的大小并不与复杂程度挂钩:某些蕨类和变形虫所拥有的 DNA 远比我们多。更大并不意味着更聪明。