一份不写在字母里的记忆
到这里,你已经见过真核生物调控的层层机制:读取启动子和增强子的转录因子,以及既能把基因深埋进压得紧紧的异染色质、也能把它摊开的染色质。但还剩一个谜。当一个肝细胞分裂时,两个子细胞都是肝细胞——绝不会冒出一个神经元。这个细胞不知怎地*记住了*自己的身份,还把这份记忆连同 DNA 一起复制了过去。而妙就妙在:你每一个细胞里的基因组,逐字逐母,都是一样的。这份记忆不可能写在序列本身里。那它在哪儿?
答案就是[[molbio-epigenetics|表观遗传]]——源自希腊语词头 *epi-*,意为“在……之上”。它是叠在 DNA 之上的那一层标记与状态,告诉细胞哪些基因开着、哪些关着,却不改写任何一个碱基。定义里最关键的词是*可遗传*:一个表观遗传改变能挺过细胞分裂,于是子细胞继承了亲代的那套设定。这正是我们先前缺的那份记忆。承担大部分工作的有两类载体——加在组蛋白尾巴上的化学标签,也就是你见过的组蛋白密码,以及直接盖在 DNA 上的一枚标签。本篇讲的就是后者,它是哺乳动物体内最稳定、也研究得最透彻的标记。
盖在 CpG 之 C 上的甲基印章
这枚标记就是 [[dna-methylation-cpg|DNA 甲基化]],它简单得令人愉悦。一种酶把一个微小的化学基团——甲基,不过是一个碳带着三个氢——接到碱基胞嘧啶上,把它变成 5-甲基胞嘧啶。从化学上说它仍是胞嘧啶;它照旧与鸟嘌呤配对,分毫不差。唯一的改变,是螺旋大沟里如今多出了一个小小的甲基凸起,读取蛋白可以在那里摸到它。可以把它想成一枚盖在信纸上的印章,却没动正文里的一个字:内容读起来一模一样,只是上面如今多了一道封印。
在哺乳动物里,这枚标签几乎只盖在“同一条链上一个胞嘧啶紧接着一个鸟嘌呤”的地方——这种位置写作 CpG(小写的 p 只代表连接二者的磷酸)。这个小细节,正是遗传的全部诀窍。由于 C 与 G 配对、G 与 C 配对,一条链上的一个 CpG 必定正对着另一条链上、按相反方向读的一个 CpG。这个图案是对称的。于是 DNA 复制时,每条新的双螺旋都有一条带甲基的旧链和一条光秃秃的新链——一种维持酶只需读取旧链上的甲基标签,再把对应的 CpG 盖到新链上即可。这枚标记就这样搭乘每一轮细胞分裂一路传下去,而这恰恰使它成为可遗传的。
CpG is symmetric across the two strands:
5'- ... C G ... -3' methyl (m) on the C
| |
3'- ... G C ... -5' and on the C of the other strand
After replication, one strand still carries m;
a maintenance enzyme copies it onto the bare new strand:
old: -m C G- new pair: -m C G-
- G C - ---> - G C m- (now restored)
So the methylation PATTERN is inherited, base for base.那么,沉默从何而来?许多基因的启动子坐落在 CpG 岛之内——这是 CpG 位点异常密集的短小区段。通常这些岛被保持得不带甲基标签,基因便随时可被开启。但一旦某个岛被甲基化,含义就翻转了:专门识别甲基化 CpG 的读取蛋白闻风而至,拽来染色质压缩机器,把这段 DNA 拉进闭合的异染色质。于是启动子被实实在在地埋了起来,转录因子再也够不着它,基因便持久地沉默下去。甲基化并不是把电线剪断;它是把门锁上。
两件著名的差事:印记与被沉默的 X
凡是一个基因必须被*持久而有选择地*关闭的地方,甲基化就派上了用场。最干净的例子是[[molbio-genomic-imprinting|基因组印记]]。大多数基因你都继承两份,父母各一,通常两份都管用。但对一小撮基因,细胞会留一个标签,记下每一份来自哪一位亲长,并只听从其中一份。另一份则被沉默——不是因为它坏了,而是因为它经由哪一位亲长传来。这个标签就是在卵子或精子形成期间盖下的甲基标记:母亲的卵子给某些基因甲基化,父亲的精子给另一批甲基化,胚胎则同时尊重这两道决定。这是对“你的两份基因拷贝是可互换的对等伙伴”这条课本规则的一个鲜明例外。
第二个范例是 [[molbio-x-chromosome-inactivation|X 染色体失活]]。雌性带两条 X 染色体,雄性一条,可两者对那数百个 X 基因所造蛋白的需求量却大致相同。在雌性里加倍剂量会有害,于是身体的对策很激烈:在雌性胚胎早期,每个细胞各自独立地、随机地关停*一整条 X 染色体*——有时是母亲那条,有时是父亲那条——并让它终生关闭,在它所有的后代细胞里也保持关闭。沉默始于一条名叫 Xist 的长非编码 RNA:它由被选中的那条 X 制造出来,像云雾一样沿整条染色体铺开,招来沉默机器;随后 DNA 甲基化登场,把这个关闭状态彻底锁死。这是写在整条染色体尺度上的表观遗传。
诚实的部分:重置、炒作与证据
现在来谈那个频上杂志封面的问题:你祖母吃过什么、熬过什么,会不会留下一枚你能继承、还能再往下传的表观遗传标记——也就是[[molbio-transgenerational-inheritance|跨代表观遗传]]?这是现代生物学里最激动人心、也最被过度宣称的观念之一,而要把它说准,就必须正视一个强大的障碍。哺乳动物的生命周期中有两次,基因组会被刻意*抹得干干净净*:一次在将变成卵子和精子的生殖细胞里,另一次紧接在受精之后,大多数表观遗传标记——包括 DNA 甲基化——都被剥除并重置。这一“重编程”的存在,正是为了把每一代的“石板”擦净。大多数标记的设计,本就是*不要*跨代遗传。
这里还有一个伪装成遗传的陷阱。一位怀孕的母亲若接触了某种东西,她的胎儿也接触了——连*那个胎儿自身*的生殖细胞也接触了,而那些细胞将成为她的孙辈。于是,在子代和孙代身上看到的效应,可能不过是三代人同时被直接暴露,并非任何经由可遗传标记传下来的东西。真正的跨代遗传要求更严格的证明:要在一个连作为生殖细胞都从未被暴露过的世代身上——通常是母系的曾孙辈——看到效应,且由一枚挺过了*两轮*重编程的标记所承载。这道门槛很高,在哺乳动物里很少被跨过。
那么,诚实的界线落在哪里?在植物和像秀丽隐杆线虫(*C. elegans*)这样的简单动物里,真正的跨代表观遗传有充分的记录——它们重编程的力度温和得多。在哺乳动物、包括人类身上,确有少数耐人寻味的案例,但严谨的、排除了直接暴露的、跨多代的证明十分罕见,而绝大多数关于“继承创伤”或“祖先饮食”的标题,都跑在数据前头老远。审慎的总结是:跨代表观遗传在某些生物里确有其事,在哺乳动物里则貌似可信、却大体未获证实,并在媒体上被例行地夸大。对那些耸动的人类宣称要保持警惕——不是因为这想法不可能,而是因为证明的门槛很高、且鲜少被达到。
甲基化在层层机制中的位置
还有两条诚实的注脚,让甲基化的分量回归恰当。其一,甲基标记通常是*伴随并强化*沉默,而非那唯一的、最初的成因——转录因子和染色质往往做出最初的决定,甲基化随后赶来把它锁定。其二,“甲基化即沉默”这条规则有明显的例外:在被活跃转录的基因体内部、以及在某些组织里,甲基化关联的是*活性*,而非沉默。一如组蛋白密码,一枚标记本身从不是魔法;它之所以重要,仅仅因为某个读取蛋白识别了它并采取行动,而那个读取蛋白做什么,取决于上下文。同一枚印章,落在何处不同,含义便不同。
退一步看,甲基化恰好嵌进你一路搭建起来的那叠机制里。转录因子和增强子投下选票;染色质状态打开或合上投票间;而 DNA 甲基化,则是那份答案中被*记住并复制*进每一个子细胞的部分——正是这一层,把一个瞬间的决定变成一份持久的身份。这就是[[molbio-combinatorial-control|组合控制]]在时间维度上的延展:众多输入汇聚成“一个基因是否开着”,而表观遗传标记让这个裁决站得住。正是凭着这一套,一个基因组、约两万个编码蛋白质的基因,才能造出、并守住一个有别于神经元的肝细胞。
而这些标记并非冻结不动。擦除酶能把甲基化剥掉,药物也能有意为之——好几种已获批的抗癌疗法,正是靠去除那些曾沉默了肿瘤抑制基因的异常甲基标签而起效——而整套系统又在每一代的生殖系里被重置。这种可逆性是把双刃剑:它既是表观遗传医学大有可为的缘由,也正是为何后天获得的标记很难被永久遗传下去。标记是真的,机制是精确的,而它的种种限度,恰恰使“表观遗传”成为一个该谨慎使用、而非顶礼膜拜的词。