JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

分子钟与中性理论

如果序列以大致稳定的速率累积改变,那么差异的数目就成了一座钟,你可以反着读它,去推算两条谱系分道扬镳的年代。木村的中性理论解释了这座钟为何会走——也解释了「中性」意味着对选择隐形,而非无关紧要。

数差异,就得到一座钟

在前两篇里,你学会了把序列对齐、并从中读出谱系——一份同源基因的比对记录着共同的祖先,而在你信任任何比较之前,必须先把直系同源与旁系同源分清。现在再往前走一步,去*数一数*。假设你把人和小鼠身上的同一个蛋白质对齐,发现一百个氨基酸位置里,比方说有十二个不同。这两个蛋白质都源自两个物种最近共同祖先体内那个唯一的祖先版本;自分裂以来,每一条谱系都一直在悄悄累积自己的替换。于是差异的数目,并非随机的琐碎信息——它记录着自这两条路分岔以来*流逝了多少时间*。这个简单的念头,就是分子钟

分子钟的威力,来自一项惊人的观察。它诞生于 1960 年代,那时人们头一回把同一个蛋白质(血红蛋白、细胞色素 c)拿到许多动物之间去比较。对一个给定的蛋白质,替换堆积的速率看上去大致是*每单位时间恒定*的——黑猩猩对人、人对小鼠、人对鲨鱼之间的差异,全都对着那些分裂的已知年代排开,像串在一根线上的珠子。如果某个蛋白质每隔几百万年大约获得一处替换,那么数出替换数、再除以那个速率,就交给你一个年代。[[molecular-clock|分子钟]]把序列差异变成流逝的时间——而且关键在于,它让你能在完全没有化石的情况下为分裂标定年代,而生命之树的绝大部分恰恰没有化石。

钟为什么会走?木村的中性理论

一座恒定的钟,是真正令人意外的。自然选择反复无常——它在不同地点、不同时代偏爱不同的性状,照理说一个蛋白质里那些*有用*的改变,应当一阵一阵地、爆发式地到来,而不是稳稳地一滴一滴落下。那么替换为何会以近乎恒定的速率累积,可靠得像放射性衰变一样?木村资生 1968 年给出的答案,即分子进化的中性理论,既简单、在当时又离经叛道:在物种之间被固定下来的替换,*大多数*根本不是由选择驱动的。它们是选择中性的——既不帮也不害这个生物体的改变,纯凭运气漂变到固定。这套理论说,选择是真实的、无处不在的,但你*在比较序列时所看到的*那一大批改变,是悄悄从它眼皮底下溜过去的。

美妙之处在此:如果一处改变是中性的,它固定的速率就只取决于突变率,而与群体大小、气候、或任何在谱系之间剧烈变动的因素无关。数学干净地相消了——中性突变以某个每代的速率出现,而每一处都有着同样微小的、漂变到固定的机会,这两个效应相乘,得到的固定速率恰好等于每代的中性突变率。于是一个大致稳定的突变率,便产出一个大致稳定的替换速率——*一座钟*。[[neutral-theory|中性理论]],就是让分子钟走动的引擎。这也重构了你早先见过的突变的谱系:少数是有害的(会被清除),极少数是有益的(会被选择青睐),而沉默的绝大多数是中性的——分子钟所数的,正是这中性的大多数,而非那戏剧性的、适应性的少数。

「中性」不等于「无关紧要」

这是整门学问里最被误解的一个词,所以在这里放慢脚步。中性意味着对选择隐形——它不意味着没用。一处改变是中性的,当把旧版本换成新版本,对这个生物体留下多少后代不造成可测量的差别时:蛋白质照样工作,细胞照样存活,适合度毫无变化。哪怕在一个确实要紧的位置上,这也可能发生——只要*那一处特定的替换*恰好被容许。想象一个长长的词,其中某个字母可以换成一种略有不同、却同样可接受的拼法——这个词的意思还是一样。这个字母在干一份活;只是它身上的这*一处特定*改变,没把那份活弄坏而已。中性,是关于一处改变*对适合度的影响*的论断,绝不是关于底下那个部件重不重要的论断。

遗传密码本身就成千上万地制造着中性改变。回想一下密码是简并的:大多数氨基酸由好几个不同的密码子拼写,通常只在第三个碱基上有别。所以一处从比方说 GGA 到 GGG 的 DNA 改变,读出来仍然是甘氨酸——蛋白质一字不差地相同。这就是一次同义(或*无声*)改变:DNA 动了,蛋白质没动,选择几乎无处着力。于是同义位点近乎自由地漂变,飞快地累积替换。它们是最清楚的例子:在功能上隐形、却又坐落在一个显然极其要紧的区域——一个蛋白质编码基因——之内的改变。

dN/dS:把中性理论变成一把检验选择的尺子

中性理论做的事比解释分子钟更妙:它递给你一把*内建的对照尺*,用来侦测选择。在一个蛋白质编码基因内部,你并排拥有两类 DNA 改变。同义改变(dS)让氨基酸保持不变,本质上是中性的,于是以背景速率漂变——它们是你的标尺,量度「在这*同一个*基因里,中性长什么样」,自动校正了这个基因自身的突变率与历史。非同义改变(dN)换掉氨基酸,因而暴露在选择之下。把这两个速率一比,中性的那批就替另一批做了标定。这个比值就是[[dn-ds-ratio|dN/dS 比值]],是分子生物学最优雅的仪器之一。

读这个比值,妙在直截了当。如果一个基因在做着要紧的事,几乎每一次氨基酸替换都会弄坏它、被[[purifying-selection|纯化选择]]清除——于是 dN 远低于 dS,dN/dS 远小于 1。这是压倒性常见的情形:大多数基因是保守的,它们那些改变蛋白质的突变被悄悄除掉。如果 dN/dS 落在接近 1 处,改变蛋白质的与无声的改变以同样的速率固定,这意味着选择几乎没在盯着——这个基因自由漂变,往往是它正朝着假基因衰败的迹象。而那罕见、激动人心的情形,是 dN/dS 大于 1:氨基酸改变固定得*比*中性基线*还快*,这只能意味着改变正被主动*青睐*——正选择,一场进化军备竞赛的指纹,就像一个免疫基因追赶一种快速突变的病毒那样。

two changes inside the SAME coding gene:

  GGA -> GGG   reads Gly -> Gly     synonymous (dS)  ~ neutral, drifts freely
  GGA -> GAA   reads Gly -> Glu     non-synonymous (dN)  seen by selection

  dN / dS  <<  1   ->  purifying selection   (gene conserved, mutations purged)
  dN / dS  ~~   1   ->  ~neutral / relaxed    (little constraint, maybe decaying)
  dN / dS  >>   1   ->  positive selection    (change actively favoured)

  dS doubles as the gene's own neutral clock and as the yardstick for dN.
由于同义改变近乎中性,无声速率(dS)既是一座局部的分子钟,又是评判改变蛋白质的改变(dN)所凭借的对照——选择,就显形为 dN/dS 偏离 1。

钟为何被抹糊——却仍被信任

诚实时间到:分子钟是真实的,但它*不是*一只精密的秒表,假装它是,曾让不少人栽过跟头。它为不同的东西走得快慢悬殊。一个要害蛋白质里受到深度约束的位点,在数亿年间几乎不变,而一个同义位点或一个假基因则一路狂奔——所以每个基因走着自己的钟,你必须用一座为你所关心的那个分子、那个时间尺度而校准过的钟。速率在谱系之间也会漂移:世代短、代谢快的动物(啮齿类)往往比缓慢、长寿的动物(人、象)走得快,因为更多的世代意味着更多轮复制、于是每百万年有更多突变。饱和也会咬人——在极漫长的时间里,同一个位点被一次又一次击中,差异不再累积,分子钟便悄悄数少了,除非你为此做出校正。

那么这座钟为何仍然有用?你去*校准*它。把树上的几个节点钉在你信得过的年代上——一块年代确凿的化石、一桩已知的地质事件(比如一座岛屿的形成)——让这些锚点去定出速率,而不是假定一个普世的滴答。现代方法用「松弛钟」走得更远:它允许速率沿着树变化,并报出一个年代的*区间*、配上诚实的误差棒,而非单独一个自信的数字。这样用起来,这套序列的比较为化石永远够不着的事件标定了年代:各大哺乳类群何时辐射分化、HIV 何时跨入人类、我们自己这条谱系与黑猩猩多晚才分手。这座钟是近似的、依赖谱系的、需要锚定的——而在这些诚实的限度之内,它是整个生物学中最强大的计时器之一。

这为什么对本级余下内容要紧

退后一步,看清中性理论究竟做了什么:它给了我们一个*零模型*——一条基线,描出当除了突变与机遇之外别无其他在起作用时,进化看上去是什么样子。正是这条基线,让选择变得可见。没有它,你便无法说一个基因是保守的(它落在中性速率之下)、或受正选择(之上)、或正在衰败(恰落在线上)。dN/dS、保守对变化的位点、「这个区域受到约束」这句话的全部含义——它们全都是*相对于*那个中性的预期来度量的。中性理论不是达尔文的反面;它是那片安静的灰色背景,正因有它,选择那一道道彩色的笔触才终于显眼起来。

这为收束本级的两篇做好了铺垫。接下来你会看到*新基因是如何诞生的*——而分子钟与 dN/dS,正是这样一套工具:它们能在一个被复制的基因刚一挣脱约束、开始漂变的那一刻就将其逮住,随后偶尔目睹它被正选择攫取、投入一份新工作。再往后,你会把同样这种替换的稳定累积,变成一张张分支图:一棵系统发生树,其中枝条的长度*就是*分子钟的距离,而拓扑*就是*那些远古分裂的次序。原来,数差异,竟是重建整部生命史的第一招。