打包难题:把两米塞进几微米
到现在你已经把基因组理解为 DNA 的整座档案库,也已经看到双螺旋是一个真实、可弯曲的分子,而不是一架僵硬的梯子。现在来面对一个赤裸裸的物理事实。如果你把一个人类细胞里所有的 DNA 拿出来首尾相接地排开,它们大约能延伸两米长。而这些 DNA 必须住进一个直径只有几微米的细胞核里——一微米是千分之一毫米。这个比例令人瞠目:这就像把四十公里长、细到不可思议的线塞进一个网球里,而且还要能随叫随到地找出其中任意一厘米。这就是 DNA 打包难题,而细胞如何解决它,正是本篇的主题。
最天真的办法,是干脆把 DNA 像揉皱的纸团那样团成一团。但这会从两个方面失败。DNA 是一条又长又带负电的线——糖-磷酸骨架上每一个磷酸基都带一个负电荷,于是这条链自己排斥自己,抗拒被挤在一起。更糟的是,一个缠成乱团的东西毫无用处:细胞必须不断地读取基因、在分裂前把整个基因组复制一遍、并修复损伤,而这一切都要求把特定的 DNA 片段取出来、对它们进行操作、再放回去,同时还不把其余一切搅成一团。真正的解决方案,必须在把 DNA 极度压紧的同时,让它保持有序且随时可取。正是这一双重要求,让答案显得如此优雅。
核小体:缠绕在组蛋白核心上的 DNA
细胞的第一步、也是最重要的一步,是把 DNA 绕到线轴上。这些线轴由组蛋白构成——这是一类小型蛋白质,其表面布满带正电的氨基酸(赖氨酸和精氨酸)。回想化学那一阶讲过的:异性电荷相吸。带正电的组蛋白紧紧抓住带负电的 DNA 骨架,顺带还中和了那股自我排斥。八个组蛋白——四种各两份——组装成一个矮墩墩的盘状核心,DNA 在它外面绕了近两圈。这个由 DNA 加蛋白质构成的“珠子”,就是核小体,它是所有真核生物染色体最基本的重复单元。
想象一下结果,一幅鲜明的图景就浮现出来:一条长线,上面每隔一定间距串着一颗颗珠子,正是经典的“串珠”模样。每一颗珠子都是一个 核小体——约 147 个碱基对缠在它的组蛋白核心上;珠与珠之间,是一小段裸露的“连接” DNA。仅仅这第一层缠绕,就已经把 DNA 缩短了大约七倍。四种核心组蛋白是整个生物学中最保守的蛋白质之列——一头牛的组蛋白与一颗豌豆的相比,也只差区区几个字母——这告诉你这项打包工作被调校得何等精细,又何等容不得出错。
linker DNA nucleosome nucleosome nucleosome
====O================O================O================O====
| | |
~147 bp wrapped bare DNA ~147 bp wrapped
around 8 histones between beads around 8 histones
"beads on a string" = first level of packaging (~7x shorter)层层折叠:从纤维到环,再到染色体
缩短七倍远远不够——我们需要把 DNA 压缩上千倍——于是这串“串珠”本身又被一次又一次地折叠。核小体串盘绕、聚拢,形成一根更粗的染色质纤维;这里还得到一个额外“连接”组蛋白的帮助,它在 DNA 进出每颗珠子的地方把链夹住。这根纤维随后被甩成一个个大环,锚定在一套蛋白质支架上,而这些环又被组织成更大的“街区”。DNA 缠在组蛋白上、再层层自我折叠所形成的整个层级结构,就是我们所说的染色质——在大多数时间里,你的染色体实际上就是由这种物质构成的。
这种折叠并不是随机的——这里要给课本图景做一处晚近而重要的修正。这些环被组织成界限分明的“街区”,叫作拓扑关联结构域(TAD):同一结构域内的 DNA 片段彼此接触的频率,远高于它们与邻近结构域 DNA 的接触。这一点很要紧,因为它让一个调控开关能够够到正确的基因、而不是错误的那个——环把相隔很远的 DNA 片段拉进同一个“房间”。诚实地说一句:过去那个标准说法,即存在一根整齐、均匀的“30 纳米纤维”作为固定的中间结构,如今受到了质疑,因为在活细胞内部,染色质看起来更像一团不规则、动态、疏密不一的物质,而不是一摞整齐划一的盘绕。这个层级结构是真实存在的;但它确切的几何形态仍在研究之中。
开与关:常染色质与异染色质
染色质并非处处压得一样紧——而正是在这里,打包不再仅仅是储存,开始变成一种控制。松散、开放的区域叫作常染色质:这里核小体彼此疏离,DNA 暴露在外,读取基因的机器能够伸进来。紧密、凝缩的区域则是异染色质:核小体被挤作一团,DNA 深埋其中,读取机器大体上被拒之门外。作一个粗略的概括:常染色质是那排开放、活跃的图书馆书架,异染色质则是上了锁的库房——不过,正如生物学里每一条干净利落的规则一样,它也有自己的例外和灰色地带。
至关重要的是,这并非一套固定的线路——它是动态的,而且可以被“记住”。随着细胞需求的变化,一个区域可以被打开或关闭,而细胞为此实实在在地花费能量:专门的机器会滑动、踢除或重新打包核小体,以暴露或藏起一个基因。在某一类细胞中,有些异染色质是永久的,终其一生都保持凝缩;另一些区域则按某种时序来回翻转。这种打包状态甚至能在细胞分裂时被复制下来,于是一个肝细胞的女儿们依旧是肝细胞。换句话说,细胞不仅仅在储存它的 DNA——它在决定哪些部分可被读取。
组蛋白尾巴:作为一层基因控制的打包
细胞是怎么决定哪里让染色质保持开放、哪里把它锁死的?答案有很大一部分就挂在组蛋白本身上。每个组蛋白都有一条柔软的尾巴——一段从核小体核心伸出来、远离缠绕 DNA 的氨基酸链。这些尾巴会被化学修饰:小的化学基团被加到、或从特定位置上移除,就像贴上或撕下标签一样。某些标记会松开核小体之间的抓握、并招募那些打开染色质的机器;另一些则吸引来把染色质压成异染色质的蛋白质。这些尾巴既是天线,也是停靠位点,它们让一个组蛋白变成了细胞可以在上面“书写”的东西。
这正是通往后面整整一阶的门口。组蛋白尾巴上的标记图案(连同直接打在 DNA 上的化学标签)构成了一层可遗传的信息,它叠加在序列之上、却不改动其中任何一个字母——这便是表观遗传学的领域。它解释了两个拥有完全相同基因组的细胞为何能分别成为神经元和皮肤细胞、并一直保持下去,也解释了打包如何从一个储存的小技巧,升格为细胞开关基因最有力的手段之一。我们会在基因调控的几阶中把这些机制好好拆解开来;眼下,先记住这个伏笔。