细胞是迄今一切的容器
在本阶梯前面的几篇指南里,你认识了作为档案的DNA、作为工作副本的RNA、作为干活主力的蛋白质,以及把它们串成 DNA -> RNA -> 蛋白质 的中心法则。但这些机器没有一个是漂在开阔空间里的,它们全都运行在一个微小的封闭口袋里,这个口袋叫细胞,而细胞是无可争议地“活着”的最小单位。你迄今学到的一切——复制基因组、读取一个基因、建造一个蛋白质——都发生在这个显微镜下的小隔间里。
让细胞成其为细胞的,是一层薄薄的、油性的“墙”——膜,它在一个有序的“内”和一个混乱的“外”之间划出了界线。在里面,细胞保管着它的DNA、一锅拥挤的蛋白质与RNA的“汤”、能量货币,以及让对的零件彼此找到对方的分子识别。最关键的是,细胞控制着它在任一时刻读取哪些基因:这就是基因表达,也正因如此,肝细胞和皮肤细胞携带着完全相同的基因组,行为却毫不相像。细胞不只是一个被动的盒子,它是信息变成行动的地方。
最深的鸿沟:有核还是无核
所有的细胞生命都归入两种宏大的“建筑风格”,而整个区别都取决于一个问题:DNA是被关进一个细胞核里,还是没有?没有细胞核的细胞叫原核生物(这个词的意思是“在核之前”);拥有真正的、由膜围起的细胞核的细胞叫真核生物(“真核”)。这条原核—真核之分是全部生物学里最重要的一道分界,远比比方说蘑菇和鲸之间的差别更深——因为蘑菇和鲸都是真核生物。
这一道墙改变了下游的一切。在像细菌这样的原核生物里,那通常是环状的基因组松散地漂在细胞中;因为没有核,转录和翻译就在同一个“房间”里同时发生——一个核糖体可以抓住一条信使RNA,在它还正从DNA上被抄出来的时候就开始建造蛋白质。在真核生物里,那大得多的基因组被打包进核内的线性染色体;转录在核内发生,随后RNA被加工、运送到细胞质,翻译在那里进行。把DNA围起来,为真核生物在两步之间腾出了做精细RNA加工的空间——可变剪接这类步骤就住在这里。
知道你面对的是哪一类细胞,就能预先大致告诉你:它的信息将如何被储存、复制和读取。细菌的基因常被捆在一起、当作一个单位来读(一个操纵子);真核生物的基因通常一次读一个,中间被非编码的内含子打断,并缠绕在蛋白质上形成染色质。所以“是原核还是真核?”是分子生物学家面对任何新生物时问的第一个问题——它为其余的一切定下了基本规则。
是三个域,不是两个
这里有一个几乎让所有人都意外的转折。“原核生物”是一个方便的描述性词语——有DNA、没有核——但它并不是生命之树上的单独一支。上世纪七十年代末,生物学家比较了一种变化缓慢的分子(核糖体核心处的那段RNA)在许多微生物之间的序列,结果发现,原核生物悄悄分成了两个截然不同的类群,它们彼此之间的距离,和它们各自与我们之间的距离一样遥远。于是生命有了三大分支,即生命的三域:细菌(Bacteria)、古菌(Archaea) 和 真核生物(Eukarya)。
细菌和古菌在显微镜下都像简单的原核生物,可它们的分子机器却讲着不同的故事。古菌中有许多生活在滚烫的温泉或盐湖里,它们运行的转录与翻译系统,在好几个方面反而更接近我们,而不是更接近细菌。真核生物——所有动物、植物、真菌和变形虫——就是那些有细胞核的细胞。如今我们认为,真核细胞本身诞生于一场“合并”:一个古菌型的宿主细胞吞下了一个细菌,后者变成了线粒体,也就是细胞的发电厂。这正是为什么你自己的细胞会在线粒体里携带一个微小而独立的基因组——那是那段远古合作关系留下的分子化石。
(root)
|
+-------+-------+
| |
BACTERIA (last common
ancestor of the
other two)
|
+------+------+
| |
ARCHAEA EUKARYA
(no nucleus) (has nucleus;
born from an
archaea + bacterium
merger -> mitochondria)一小撮模式生物
生命有数以百万计的物种,但分子生物学的大部分经验,是从一小撮精心挑选的生物身上学来的,它们被称作模式生物。其中的逻辑既简单又强大:因为核心的机器——遗传密码、DNA被复制的方式、蛋白质被建造的方式——为所有生命所共享,所以你在一种方便、长得快的生物身上发现的东西,通常远不止适用于它本身。正如遗传学家雅克·莫诺(Jacques Monod)所说:“对大肠杆菌成立的,对大象也成立。”你研究那个容易研究的生物,然后信赖深层的保守性,把这条经验带到那些难研究的生物身上。
- 大肠杆菌(一种肠道细菌):这个领域的主力。便宜、约每20分钟分裂一次、基因组小(约460万碱基对),还乐于通过质粒接受外来DNA。遗传密码、转录、翻译、乳糖操纵子,以及最早的重组DNA,全都是在大肠杆菌身上弄清楚的。
- 面包酵母(酿酒酵母 Saccharomyces cerevisiae):最简单的真核生物,就是那个用来烤面包、酿啤酒的家伙。它像我们一样拥有细胞核、染色体和染色质,却长得像微生物一样快——研究细胞周期、基因调控以及真核细胞如何分裂的首选模型。
- 线虫(秀丽隐杆线虫 Caenorhabditis elegans):一种微小、透明的圆虫,全身恰好959个体细胞,而且每一个都被绘制了出来。因为你能从受精卵一直看着每一个细胞长到成虫,它成了研究身体如何被建造、以及程序性细胞死亡(凋亡)的模型。
- 果蝇(黑腹果蝇 Drosophila melanogaster):正是这种果蝇教会了遗传学“染色体如何携带基因”,后来又揭示了那套主控“体格蓝图”的基因(Hox 基因),它们安排了从头到尾的布局——这些基因保守得如此之深,以至于它们的近亲也在为我们自己的身体划定格局。
- 小鼠(小家鼠 Mus musculus):日常研究中最接近人类生物学的替身——一种哺乳动物,我们能敲除或编辑它的基因,使它成为研究疾病、免疫和发育的主力,而这些研究在人身上是无法做实验的。
- 拟南芥(Arabidopsis thaliana):芥菜家族里一种开花很快的小杂草,是“植物界的实验小鼠”。它基因组紧凑、生命周期短,我们关于植物基因、开花,以及植物如何回应外界的大部分知识,最初都是在它身上被揭示出来的。
分子世界的尺度
这一切都发生在我们肉眼远远看不见的尺度上,所以用几个真实的数字给分子世界的尺度定个锚会很有帮助。常用的尺子是纳米(nm),它是一米的十亿分之一,比一毫米还小一百万倍。DNA双螺旋大约2纳米宽,而梯子上的一格——一个碱基对——只有约0.34纳米长。一个典型的蛋白质有几纳米宽;一个大肠杆菌大约1000纳米(一微米)长;一个动物细胞大概比它再大十到一百倍。
至于信息,我们用碱基对(bp)来数,通常以千(千碱基,kb)或百万(兆碱基,Mb)为单位。一个典型的基因有几kb;大肠杆菌的基因组有几Mb;人类基因组大约3000 Mb——也就是约三十亿个碱基对,正是人类基因组计划完整读出的那个数目。这里有一个该让你眨眼的事实:把一个人类细胞里的DNA首尾拉直,长约两米,而它却要折叠进一个直径只有约6000纳米的核里。把两米长的“线”塞进一个仅为其长度十万分之一的小球里,这就是细胞每天要解决的打包难题。
为什么从这里开始才对
现在舞台已经搭好。分子活动住在细胞里;细胞有两种建筑——原核与真核,又分散在三个深层的域之间;这个领域通过一小撮模式生物来读取这些细胞;而整出戏都在纳米和碱基对的尺度上上演。本阶梯后面的每一级——复制、转录、翻译、调控、实验工具、医学——都不过是往这个框架里填进去的细节。
往上爬时,把两条诚实的提醒揣在口袋里。第一,原核—真核的图景是一个干净的二分法,但真实的树有三个域,而“原核”不过是按“缺了什么”给其中两个域起的名字。第二,模式生物之所以管用,是因为生命被深深地保守着——可保守从来不是百分之百,所以一个结果是关于其他物种的一个假说,而不是一个证明。把全局握紧,把例外握松,前方的细节就会各就各位。