损伤不等于突变
上一篇指南把突变究竟是什么钉死了:它是被写进基因组序列、并被忠实地一路复制下去的永久性改变。这一篇要往故事的前一步退,去追问这些改变最初究竟从何而来。关键的区分在于:突变是那个已经定型、可遗传的错误,但它几乎总是始于一处 DNA 损伤——分子上一道尚未被复制的化学伤口。损伤是纸页上的一处污渍;突变则是那处污渍被忠实地敲进了往后的每一份副本。
为什么这个区分如此重要?因为在损伤与突变之间,横着一扇机会之窗。一道在下一轮复制之前就被修复的伤口,不会留下任何痕迹——它根本就不会变成突变。损伤只有在细胞先越过它去复制时才会硬化成突变,把错误锁死在一条新链上,而那时已经没有一条未受损的搭档链可以指明真相。这扇窗,正是本级阶梯余下篇章里那些修复系统大显身手的地方。所以在我们能欣赏修复之前,得先诚实地把它们要对付的东西清点一遍——一个基因组每一天究竟承受着多么惊人的损伤量。
复制时的失手
麻烦的第一个来源,是细胞自己的复制机器。上一级里你看到复制体对着一条旧链铺出一条新链,一个碱基接一个碱基,每一步都在问进来的碱基是否与模板正确配对。绝大多数时候它都答对了——但并非每一次。它时不时会把一个错误的碱基塞进去:比方说,本该是 A 的位置上对着 T 放了个 G。这种错误的配对就是错配,也是最基本的一类复制错误。
还有两类复制失手值得点名。当聚合酶跑过一段短的重复序列——一串 A,或者 CACACA…… 这样的图案——两条链会短暂地错开位置、错一个重复单元再重新配上,于是新链最后多出一份拷贝、或少了一份。这种链滑移正是小的插入与缺失通常的来源,而它们若落在编码区,就会造成你上一篇见过的移码。令人鼓舞的是,复制错误是最可预防的一类损伤:你已经见过聚合酶内建的校对当场抓住大多数失手,还有一支专门的错配修复队伍负责扫清校对漏掉的大部分。两者合力,把最终的错误率压到大约十亿个碱基里出一个错——已经非凡,却仍然不是零。
DNA 自己解体
有一个几乎让所有人都意外的事实:DNA 不需要有敌人,也照样会受损。仅仅泡在细胞温暖的水性内部,这个分子就在自顾自地缓缓解体——不需要阳光、不需要化学物质、也不需要辐射。这就是自发性损伤,而且它从不停歇。寻常的热让每个原子都在抖动,水本身又略带活泼,于是那些我们爱以为坚不可摧的化学键,其实时不时就在自行断裂。把 DNA 想成一座僵硬、永恒的档案库虽令人安心,却是错的;它是一个动态的分子,正承受着来自内部、稳定而低强度的化学侵蚀。
有两类自发事件占了主导。脱嘌呤是碱基的悄然脱落:把一个嘌呤(一个 A 或一个 G)连到骨架上糖分子的那根化学键被水解——因与水反应而断裂——留下一个完全没有碱基的缺口,而骨架本身仍然完整。仅靠这种方式,一个人类细胞每天就脱落数以千计的嘌呤,每个都留下一处复制机器无法读取的空位。脱氨则是碱基失去一个氨基,它最出名的例子是胞嘧啶变成尿嘧啶。这一种之所以阴险,原因很精确:尿嘧啶的配对方式像胸腺嘧啶,所以一个未被修复的脱氨 C,在下一次链被复制时会被读成 T——一个现成的 C 变 T 转换,也是已研究过的每个基因组里最常见的突变之一。
来自外界的攻击:诱变剂
在那持续不断的内部嗡鸣之上,基因组还遭到来自外界因子的轰击。任何通过损伤 DNA 或扰乱其复制而提高突变率的因子,都是诱变剂。如果说自发损伤是背景噪声,那么诱变剂就是把音量调大——有时还调得很猛。诱变剂大致分两大家族:辐射与化学物质,而看清它们各自留下印记的方式有多不同,是值得的。
先看来自太阳的紫外线。它的能量会做一件出奇特定的事:让*同一*条链上相邻的两个胸腺嘧啶碱基彼此直接成键,熔合成一个僵硬的疙瘩,称为胸腺嘧啶二聚体。可以想象梯子上相邻的两级横档突然被侧向焊在一起——原本平滑的螺旋如今带着一处僵硬的扭结。这处扭结再也无法跨过去与对侧链配对,而且它会从物理上挡住复制和读取 DNA 的酶,使它们撞上时停滞。若不修复就试图越过它复制,机器可能对损伤对面应有的碱基猜错,从而埋下一个突变。这正是晒伤与皮肤癌相关联的分子缘由。
电离辐射——X 射线、γ 射线、宇宙射线中的高能粒子——则要凶残得多。它携带的能量足以把电子从原子上直接撞飞,而它最恶劣的手段之一,就是径直把糖-磷酸骨架折断。折断一条链,完好的搭档链还能把分子拢在一起;若把附近的*两*条链都折断,染色体就被截成两段松散的碎片。这种双链断裂是基因组所能遭受的最危险的损伤,因为此时附近再也没有一条未受损的链可充当模板——要干净地修好它,得动用我们很快会见到的、专门的双链断裂修复机器。化学诱变剂构成第三条战线。有些如亚硝酸,以自发衰变的方式使碱基脱氨,只是更快;烷化剂把笨重的化学基团粘到碱基上、使其错配;5-溴尿嘧啶等碱基类似物伪装成正常碱基、随后草率配对;而扁平的环状嵌入剂则滑入堆叠的碱基对之间,骗复制酶多加或漏掉一个碱基,造成移码。
A small map of the damage (and the typical mutation it threatens): replication slip ...... wrong base inserted ....... point mutation strand slippage ....... repeat copied wrong ........ insertion / deletion depurination .......... base lost -> abasic gap .... wrong guess on copying deamination (C->U) .... C reads as T ............... C-to-T transition UV light .............. T=T thymine dimer .......... block + miscopy ionising radiation .... backbone snapped ........... single / double-strand break alkylating agent ...... bulky group on base ........ mispairing intercalator .......... wedged between pairs ....... frameshift
揪出诱变剂:Ames 试验
如果诱变剂是突变率中可控的那一部分,我们就迫切想要一种又快又省的办法,去问任何一种新化学品:它会损伤 DNA 吗?经典的答案是Ames 试验,由布鲁斯·埃姆斯在 1970 年代设计,其逻辑美在简单。它用一株被一个突变故意弄残的*沙门氏菌*,使它*无法*合成氨基酸组氨酸,因而无法在缺组氨酸的培养皿上生长。第二个突变若把第一个逆转过来——也就是回复突变——便恢复了生长能力。于是这项试验把突变率直接读作那些“起死回生”的细菌菌落的数目。
- 把数百万个依赖组氨酸的细菌铺在一块几乎不含组氨酸的培养皿上,于是若不发生新的突变,它们几乎都长不起来。
- 把你想检验的化学品加到这块培养皿上;再另设一块完全相同、但不加该化学品的培养皿作为对照。
- 培养一段时间,然后只需数菌落。每一个菌落都源自一个发生了回复突变、从而重获合成组氨酸能力的细菌。
- 对比计数:检验皿上的菌落远多于对照皿,就意味着该化学品在提高突变率——它是诱变剂,而菌落越多,诱变性越强。
为什么“什么都不做”不是一个选项
把这一切加起来,数字令人清醒。脱嘌呤、脱氨、氧化、复制失手,再加上背景辐射与活泼化学物质的每日剂量——你体内的每一个细胞,每天都要承受数以万计的 DNA 损伤。现在设想一个对它们置之不理的细胞。损伤会随每一小时的流逝而累积;缺口和断裂的骨架会让下一轮复制停滞;被复制错的碱基硬化成突变的速度,会快到永远无法被容忍。必需基因会被破坏,约束细胞分裂的那些控制会失灵,于是这一支谱系要么干脆死去,要么坠入我们称之为癌症的失控生长。一个毫无防御的基因组不是一座稳定的档案库——它是一份正以被写下的速度同时溶解着的文档。
因此,你正在读这些文字这一事实本身——生命已延续了数十亿年,而你的细胞所携带的基因组,历经这一切侵蚀之后仍然可读——就已经证明了:必定存在着强大的修复。让损伤无可避免的那套化学,同时也让修复成为可能,这绝非偶然:正因为 DNA 是双链的,一条链上的伤口几乎总能通过读取完好的搭档链来修补。这正是本级阶梯余下篇章要扯动的那根线。我们将看着细胞揪出一个脱氨的碱基(碱基切除修复)、切除一个笨重的胸腺嘧啶二聚体、纠正一处新鲜的错配,并把一条被截断的染色体重新缝合。一路上请记住一个诚实的平衡:目标从来不是*完美*的保真。一个抹去每一处改变的细胞,也会抹去那些罕见而有益的改变,于是生命将无可变之物。修复瞄准的是一个甜蜜点——忠实到足以存活,又有漏到足以持续演化。