四个家族,一张购物清单
通过本阶之前的内容你已经知道,分子生物学会一路放大,直到看清真正干活的那些分子,而中心法则则勾勒出它们之间的物流往来。现在该认识这些主角了。如果把一个细胞煮干,再按组成把大分子分类,几乎一切都落进区区四个家族:核酸(DNA 和 RNA)、蛋白质、碳水化合物和脂质。这四个家族几乎掌管着全部生命活动——对于像你这般精巧的存在来说,这张购物清单短得惊人。
其中三个家族——核酸、蛋白质和碳水化合物——都是被称为生物大分子的庞然大物:长达数千个单元的链,远比水或作甜味剂的糖这类普通分子要大。脂质则是个例外:它并不是真正的长链,而是一些更小、油腻、彼此聚拢的分子。先把这个例外记在心里,我们稍后会回头细说,因为正是它让细胞膜成为可能。
把珠子串成链:从单体到聚合物
下面这个思想把三大类巨型分子统一了起来,而且妙在极其省事。大自然不会为每项任务都发明一种全新的分子,而是常备一小套标准的小零件——单体,也就是珠子——再把它们串成长链——聚合物,也就是项链。这就是单体—聚合物原理。正如 26 个字母能拼出英语里所有单词,一套很小的单体字母表,只要排列顺序不同,就能拼出几乎无穷无尽的各色大分子。
每个家族都有自己的珠子。核酸是核苷酸串成的链——而 DNA 中只有四种(A、T、G、C)。蛋白质是氨基酸串成的链,取自一套二十种的集合。碳水化合物是糖串成的链,往往只是同一种糖反复重复,比如葡萄糖连成淀粉。对核酸和蛋白质来说,珠子的排列顺序至关重要;而对许多碳水化合物而言,顺序的影响要小得多——这正暗示了它们职责的不同。
细胞究竟是怎么把一颗珠子扣到链上的呢?靠的是缩合反应:把两个单元连接起来,并在接口处挤出一分子水,就像让出一滴胶水。把这个过程反过来——重新加上水,把键打断——就是水解,你把三明治消化成可重复利用的单体,靠的正是它。同样这两招——靠缩合来搭建、靠水解来拆解——既组装也回收着全部三类聚合物。
谁负责什么
现在来看分工。核酸负责携带信息。DNA 是细胞稳定的档案库,是指令的母版,用那套四字母字母表写成;RNA 则是细胞真要使用某条指令时所抄出的工作副本。信息就藏在珠子的排列顺序里,别无其他。
蛋白质负责干活。它们是细胞的劳动力大军:加速化学反应的酶、赋予形状的纤维、膜上的泵与通道、负责防御的抗体、推动运动的马达。每当细胞里有什么事情在发生,几乎总有一种蛋白质在操办——参见种类繁多的蛋白质功能类别。关键的玄机在于,蛋白质的职能来自它的三维形状,而这个形状又来自其氨基酸珠子的排列顺序。序列决定形状,形状决定功能。
碳水化合物是多才多艺的中间兄弟:既是速效燃料(葡萄糖),又是大批储能物(植物里的淀粉、你体内的糖原),还是坚韧的建材(木头里的纤维素、昆虫外壳里的几丁质)。它们还像名牌一样包覆在细胞外表,供别的细胞辨认。脂质这个非聚合物家族主要做两件事:以脂肪形式长期储能,以及——至关重要的——构成一切膜的那层油性薄片。由于脂质分子一头亲水、另一头拒水,它们会自发排成双层,形成一道自动竖起的墙,划定细胞的边界。
为何两个家族独占聚光灯
分子生物学对四个家族都关心,却把口径最大的那台望远镜对准了其中两个:核酸,以及由它们编码的蛋白质。为什么偏偏是这一对?因为它们正是定义生命的那条信息流的两端。DNA 中字母的顺序被抄写进 RNA,RNA 中字母的顺序又被读出,用来确定蛋白质里氨基酸的排列顺序。信息从一种分子进去,最终化作一台能干活的机器出来。
INFORMATION WORK DNA --transcription--> RNA --translation--> PROTEIN (archive) (copy) (machine) A,T,G,C A,U,G,C 20 amino acids
聚光灯落在这里还有第二个原因:核酸和蛋白质是仅有的两个家族,其精确序列能被我们逐个字母地读取、书写和推理。我们能给一个基因组测序,能把两条蛋白质对齐比对,能改写单个碱基。碳水化合物和脂质则更难当作文本来处理,部分是因为它们的顺序没那么重要,又以各种方式分叉,难以简单读取。于是,最富信息性的那些分子,恰恰也是我们最能强力操控的——这正是为什么本阶梯的大部分内容,从复制到遗传密码再到 CRISPR,都铺陈在那条从 DNA 到蛋白质的线上。
继续攀登前的几条诚实注脚
还有两条值得随身携带的提醒。其一,“DNA 储存、蛋白质干活”是惯常的分工,但这并非一堵密不透风的墙:RNA 既能携带信息,也能真正干活,甚至充当酶——在后续的阶层你会看到,“信息”与“机器”之间的界线,比这第一张地图暗示的要模糊得多。其二,千万别把 DNA 想象成一架僵硬地躺在保险库里的梯子——它是一条又长又柔韧、时刻被反复摆弄的分子。这些简化是脚手架,结实到足以让你踩着往上爬;接下来的指南会把它们重新描绘成真实而更有趣的细节。