JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

相同的 DNA,不同的细胞:调控为何重要

一个神经元和一个皮肤细胞携带着完全相同的基因组,却几乎不能再不同了。原因在于调控——每个细胞选择运行哪些基因。来认识这个把基因组从一张蓝图变成一个程序的核心想法。

同一本书,每个细胞里都有——那它们为什么各不相同?

等你爬到这一级时,你已经从上一级带来了一个惊人的事实:你体内几乎每个细胞都携带着*同一份*完整的基因组——同样那条两米长的 DNA 线,同样那约两万个基因,一个字母都不差。你的肝细胞和脑细胞都是从同一个受精卵复制而来,而复制机器又异常忠实,所以每个细胞手里的那本书在本质上是一模一样的。然而,一个神经元——满是细长分叉的电线、噼里啪啦地放电——和一个皮肤细胞——扁平、坚韧、忙着替你防水——却几乎不能再不同了。它们读着同一本书,行为却像截然不同的生物。

这正是整整一级要去解开的谜题,在我们回答它之前,值得让它先扎得人有点疼。如果指令完全相同,那差别从何而来?它不可能在文本里,因为文本是一样的。所以它必定在*文本如何被使用*之中——在每个细胞选择朗读哪些段落、又把哪些合着不读之中。这种选择有一个你在术语表里已经见过的名字:[[gene-expression|基因表达]],也就是细胞把一个基因真正拿来制造出某样东西的行为。整整一级的答案,用一句话说,就是:不同的细胞表达不同的基因。

差异基因表达:运行程序的一个子集

我们把这一点讲具体。在你那约两万个编码蛋白质的基因里,有相当一批核心基因——所谓的管家基因——几乎在每个细胞里都运行着,因为每个细胞都需要产生能量、构建 RNA、并维持自己的存活。但在这层共享的基础之上,每一种细胞类型会开启它自己那套特别的基因,让其余的保持沉默。这就是差异基因表达:不同的细胞类型表达着同一基因组里的不同子集。一个胰腺 β 细胞把胰岛素基因开到最大音量;一个皮肤细胞携带着完全相同的基因,却从不去读它,于是它根本不制造胰岛素。

还要注意,表达也不是一个简单的开/关开关。一个基因可以被微弱地低语,也可以扯着嗓子大喊,而*水平*往往和“是与否”一样重要。两个细胞或许都表达同一个基因,但一个表达十份、另一个表达一万份,仅这一点差别就能重塑细胞的所作所为。所以真实的图景是一块巨大的混音台,而不是一排电灯开关:成千上万个推子,每一个都设在自己的位置上,而这套具体的设置——所有基因上的那个模式——正是让一个细胞成为神经元而非皮肤细胞的原因。

same genome in every cell -- different sliders pushed up

              insulin  keratin  neuron-wiring  housekeeping
  beta cell    |####|   |    |     |    |        |####|
  skin cell    |    |   |####|     |    |        |####|
  neuron       |    |   |    |     |####|        |####|

  identical instructions, different settings = different cells
每个细胞都拥有相同的基因;细胞的身份就是哪些推子被推高的那个模式。管家那一组到处都运行;而专门化的基因则各不相同。

这个控制问题的规模

一旦你把表达看成一块混音台,接下来要去体会的,就是这个控制问题究竟有多大。一个人体大约要造出两百种经典的细胞类型——若把现代方法所揭示的那些细微差别也算进去,则远不止此——每一种都需要在那约两万个基因上有自己特征性的设置。而这些设置并非终生不变:一个肝细胞在餐后把处理糖分的基因调高,几小时后又调回去;一个免疫细胞在遇到一个微生物的几分钟之内,就把自己整套表达谱重写一遍。细胞并不是把这块板子设定好一次就完事;它在不断地重新调音,以回应它身处何地、此刻是什么时间、以及刚刚发生了什么。

这里,上一级的一个数字会突然对上号。你学过,基因组里真正编码蛋白质的仅约 1%–2%,其余大部分是非编码 DNA——并非垃圾,而是相当大一部分属于调控性的。现在你能看出*为什么*一个基因组会拿出这么大的篇幅来搞控制:让两万个基因在数百种细胞类型、以及一生不断变化的条件下都设置正确,是一个远比单纯列出零件清单要难得多的问题。那套决定每个零件何时被使用的接线,至少要和零件清单本身一样精细——而这套接线,正是非编码基因组的大部分所在之处。

蓝图还是程序?重新理解基因组

人们常把 DNA 称作*蓝图*,这是个诱人的比喻——但它是错的,而看清它为什么错,正是本篇真正的收获。蓝图是一张静止的图纸,上面每一条线对应着一堵墙:它把成品一部分对一部分、一次性地全画出来。基因组完全不是这样。你的 DNA 里任何地方都没有一只手或一只眼睛的小图。相反,基因组的表现远更像一个程序——一套*随时间运行*的指令,同样的指令会因为它执行时的条件不同,而产生天差地别的结果。

这一重新理解会改变你在本级里读到的一切。程序里有条件判断——*如果*这个信号到来,*那么*就运行那一块基因。它有彼此调用的子程序,于是拨动一个主开关就能引发一连串连锁反应。而完全相同的代码,喂进不同的输入,就能在一处造出神经元、在另一处造出皮肤细胞。细胞的开关大多是一类叫转录因子的蛋白质,它们结合到 DNA 上,决定哪些基因被读取;又因为基因通常是由这些因子的*组合*来控制的——即组合调控——一份不大的工具箱就能指定数目庞大的不同结果,就像 26 个字母能拼出数不清的单词。

这一级接下来要去哪里

现在你已经握有了问题,也握有了答案的大致形状;这一级余下的部分,就是把其中的机器一一填上。我们将从控制最简单、最清晰的地方开始:细菌,它们把相关的基因捆在共用的开关之下,根据周围环境里的食物来拨动它们——这是那个经典、被理解得极为透彻的例子。接着我们跨入我们自己这类细胞,那里的控制是分层而组合式的,还有从远处起作用的开关。再往后是更微妙的一层——写在 DNA *之上*、能在一个字母都不动的情况下改变表达、甚至能被遗传下去的设置——最后,则是这些控制如何彼此编织成稳定的网络,把一个细胞锁定在它的身份之中。

在往上爬的过程中,请记住一条贯穿始终的主线。前面每一个机制,其实都是对我们开篇那个问题的回答:从一份共享的基因组里,一个细胞究竟如何决定运行哪些基因、何时运行、运行得多响?这正是后面发育那一级里细胞如何选定一份工作背后的引擎,是一个胚胎如何从单个细胞长成的背后引擎,也是疾病中许多差错的背后引擎——当错误的基因被开启时。那些可遗传却又可逆的设置,有一个更深的名字——表观遗传学——很快会有专门的一篇小心地讲它,剥去它常常招来的那层神秘色彩。调控并不是基因组的一个脚注;它正是基因组如何真正成为一个活物的方式。