JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

细胞为何要调控基因

一个细胞所携带的基因,远多于它一次能用上的。本篇讲清:为何它必须随着外界变化把基因开开关关,为何最省钱的开关恰恰装在转录的最开头,以及组织起整门学问的那四个词——负控制、正控制、可诱导、可阻遏。

问题所在:基因组在多数时候,大半都没在用

上一级以一个承诺收尾:转录、尤其是它的第一步,是细胞的总开关——而接下来的几级,会展示细胞究竟如何操作这个开关。这里便是它的起点。你已经从转录作为控制点那篇知道了结论:DNA 完全相同的细胞之所以不同,是因为它们读取的基因不同。现在我们把它落成一台真正运转的机器,去追问它底下那个更朴素的问题——究竟为何要费心去调控?为何不干脆让每个基因都一直开着?

从一个细菌说起——大肠杆菌(*Escherichia coli*),正在你的肠道里游动。它的基因组藏着几千个基因——也就是几千种不同蛋白质的菜谱。但在任何一个瞬间,这些菜谱里只有一小部分值得下厨。倘若它周围的汤水里满是葡萄糖,那么消化某种罕见糖类的基因,就是毫无用处的累赘。倘若色氨酸这种氨基酸正大量漂浮在四周,那么*从头合成*色氨酸的基因,纯属浪费——既然东西已经摊在地上,何必再开一座工厂去造它?一个把一切都永远转录的细胞,就好比一间厨房,所有炉灶都点着、所有菜谱都在没日没夜地烹,不管有没有人点这道菜。

所以基因调控的核心问题,是一种尺度上的错配:基因组是一座装满*可能*蛋白质的浩瀚图书馆,而细胞在任一时刻,所需的只是其中一小撮、不断变动的*实际*蛋白质。而这一小撮始终在变,因为细胞所处的世界始终在变——一种糖出现了,一种养分耗尽了,温度骤升了,一种毒素飘过来了。调控,无非就是细胞把它所造之物,时时刻刻地去匹配它处境的所需。整个[[gene-regulation-principle|基因调控原理]],讲的就是这笔经济账:在你需要的时候,造你所需的,其余的不造。

为何开关该装在开头,而非末端

原则上,你可以在这条流水线的任何一点上控制某蛋白质的水平——放任它的基因自由转录、再把 RNA 剁碎,或者把蛋白质造出来、再立刻销毁。这些细胞确实样样都干。但你已经见过转录何以胜出、成为*默认*控制点的那个理由:代价。聚合酶每缝进一个核苷酸,都要付出一笔不利的自由能变化,而细胞靠焚烧富能的三磷酸来兜底。先造出一条长达数百个核苷酸的信使 RNA,再造出一个长达数百个氨基酸的蛋白质,*然后*把两者都扔掉,就好比印好并装订一本厚册子,只为把它丢进碎纸机。精打细算的做法,是压根别开始。

而在转录自己的三幕——起始、延伸、终止——之中,控制又堆在了第一幕上。这里有一个机械上的原因:聚合酶一旦清离启动子、落入快速而平滑的延伸,就已下定决心、难以叫停。起始才是那一慢而磨人、又可逆的步骤——找到启动子、把 DNA 熔开、决定要不要下定决心。这道慢闸门,正是天然该上锁的地方。所以一个调控因子的活儿,本质上就是去控制聚合酶在某一个特定启动子上有多容易开始。

拨动它的两种方式:负控制与正控制

现在来说机理。一个调控因子,就是一种结合在启动子附近某段特定 DNA 上的蛋白质,而它的作用方式只有两种、彼此相反。[[negative-control|负控制]]靠的是*阻遏蛋白*:一种坐在 DNA 上、堵住转录的蛋白质——把它想成一名站在门口的守卫,死活不让聚合酶过去。把阻遏蛋白挪开或令其失效,基因就被打开(ON)。*正控制*则反着来,靠的是*激活蛋白*:一种帮助本来懒洋洋的聚合酶起步的蛋白质——把它想成一名领座员,挥手把聚合酶引进来。没有激活蛋白,基因大体上保持关闭(OFF);加上它,转录就攀升起来。

关键的诀窍——也是多数初学者犯迷糊的根源——在于这些调控因子的状态并非一成不变。一个小分子可以结合调控蛋白、改变它的形状,从而切换它究竟是抓住 DNA、还是松手放开。这正是细胞*感知*外界的方式:那个小分子,往往恰恰就是这个基因即将要去响应的那种养分或信号。于是这条链是这样走的:环境里的一个分子结合上调控因子,调控因子改变形状,它对 DNA 的抓握或紧或松,基因的转录便随之升或降。环境,实际上就这样伸手进来拨动了开关——却从不去碰 DNA 序列本身。

两类要办的事:可诱导系统与可阻遏系统

负和正,描述的是调控因子*如何*作用。另一对词,描述的是细胞在办*哪一类活儿*,而它们正是直接来自我们开篇时那两种相反的需求。细菌的基因,按行为分成两大类,由可诱导与可阻遏之分来概括。一个可诱导的基因,平时是关闭的,当它的信号出现时被打开——是信号*诱导*了它。一个可阻遏的基因,平时是开启的,当它的信号出现时被关掉——是信号*阻遏*了它。这两种模式,恰好对上那两种需求。

回想那两个例子。消化某种罕见糖类的基因,最好一直关着,直到那种糖现身——所以它们是*可诱导*的,而那种糖(或由它衍生出的某个分子)就是把它们打开的诱导物。这正是著名的[[molbio-lac-operon|lac 操纵子]]——利用乳糖的那组基因——所遵循的逻辑。而*合成*氨基酸色氨酸的基因,最好一直开着,直到色氨酸已经富足——届时它们就该关停,因为既然能直接舀取,细胞便可停止再造。所以它们是*可阻遏*的,而色氨酸本身就是把它们关掉的信号。这便是[[molbio-trp-operon|trp 操纵子]]。分解代谢的基因(把食物拆开)往往可诱导;合成代谢的基因(把东西搭起来)往往可阻遏——这是一条整齐的经验法则,有例外,却着实好用。

TWO AXES OF BACTERIAL CONTROL (independent of each other)

  HOW a regulator acts:
    negative control = a REPRESSOR blocks the promoter   (remove it -> ON)
    positive control = an ACTIVATOR helps the polymerase  (add it   -> ON)

  WHAT the gene's job is:
    inducible  = normally OFF, signal turns it ON   (e.g. lac: use lactose)
    repressible= normally ON,  signal turns it OFF  (e.g. trp: make tryptophan)

  the signal = a small molecule that binds the regulator and changes its shape
对任何一个细菌基因,都有两个彼此独立的问题:它*如何*被调控(阻遏蛋白还是激活蛋白),以及它遵循*哪种*模式(可诱导还是可阻遏)。lac 与 trp 操纵子,正是经典的范例。

细菌为何是最佳的课堂

这门学问之所以从细菌讲起,是有缘由的,而且不只是因为历史。在细菌里,调控以它最朴素、最易读的形式呈现出来。办同一件事的基因,常被捆进一个单一的转录单元——一个[[molbio-operon|操纵子]]——坐落在一个启动子之下,并被读成一条长长的多顺反子 mRNA,这条 mRNA 携带着好几个蛋白质的份的信息。在操纵子开头拨动那唯一的一个开关,整组基因就一起开或一起关。这里没有细胞核把转录与翻译隔开,没有染色质把基因埋起来,调控因子也无需长途奔波:阻遏蛋白或激活蛋白结合 DNA 的地方,几乎就紧挨着它将要发挥作用之处。

在这套干净利落的构造之外,细菌还是实验者梦寐以求的对象——这正是大肠杆菌成为分子生物学主力模式生物的缘由。它每二十分钟分裂一次,一夜之间就能在烧瓶里长出数十亿个,喂养便宜、易于诱变。你可以用一个突变破坏掉某个调控因子,看着一个基因永久地卡在开启或关闭,再从结果上把逻辑直接读出来。lac 操纵子正是在二十世纪六十年代初,由弗朗索瓦·雅各布(François Jacob)和雅克·莫诺(Jacques Monod)以这种方式破译的——这项工作赢得了诺贝尔奖,并实际上奠定了基因调控这一领域。你即将动用的整套概念工具,都是在这一种细菌身上锻造出来的。

不过对它的局限要诚实:细菌是最简单的课堂,却不是整所学校。你自己的细胞,调控的是同样的第一步——它们决定要转录什么——但把这一步裹在多得多的机器里,那是下一级要处理的。操纵子大体上是一种原核的安排;真核生物通常一次只转录一个基因,会加上称为增强子的远处控制元件,而且必须先把 DNA 从染色质里拆出来,任何东西才读得了。所以,把细菌的开关当作那个干净的、奠基性的案例来学——在这里,负、正、可诱导、可阻遏的那套赤裸逻辑被摊在了明面上——再把这套逻辑往上带,心里清楚:真核版本,是同一个想法,只是多穿了好几层衣裳。