细菌真正要解决的问题
在前两篇里,你认识了[[molbio-operon|操纵子]]——一簇负责同一件工作的基因,被串在同一个启动子之下,作为单条多顺反子 mRNA 读出;你也认识了负控制的想法:一个阻遏蛋白坐在 DNA 上、挡住转录,直到有什么东西叫它松手。现在,我们把一个例子从头到尾走一遍,因为正是这一个例子,胜过其余任何例子,让这个领域第一次真正*看见*了一个基因被开关。它就是大肠杆菌的[[molbio-lac-operon|乳糖操纵子]]——这种肠道细菌自 1950 年代起,便是分子生物学最钟爱的实验动物。
用大白话想想细菌每天面对的两难。它最爱的食物是葡萄糖——一种它能不费周章、马上烧掉的简单糖。可世界并不总这么仁慈,有时候周围唯一的糖是乳糖,也就是牛奶里的糖。乳糖是个更大的分子:两个糖连在一起,细胞在把它劈开之前,根本没法用它。负责这一劈的酶是 β-半乳糖苷酶,而编码这个酶的基因——叫 lacZ——正是这个操纵子的心脏。两个帮手基因与它同行:lacY,一个把乳糖横穿细胞膜拽进来的泵;还有 lacA,它的活儿我们暂且按下不表。
于是细菌想要一条规则,而这条规则不过是常识:只在乳糖真的就在眼前时,才造出吃乳糖的机器;即便如此,要是那种省事的糖——葡萄糖——还摆在桌上,也犯不着费这个劲。造 β-半乳糖苷酶并不免费——回想转录那一级,读一个基因、一个氨基酸一个氨基酸地组装一个蛋白质,是何等花费。一个造了乳糖酶却从不用它的细胞,会在竞赛中输给更会精打细算的邻居。乳糖操纵子的奇妙之处在于:这条合情合理的规则,竟全靠分子彼此撞来撞去来执行。这里没有任何决策者。那逻辑*本身*,就是化学。
阻遏蛋白:一个默认踩着的刹车
在脑海里把这段 DNA 摊开,像一条短短的街道。最前面是一个调控基因 lacI,无论如何,细胞都以低而稳的速率读它——它总在悄悄地造着它的产物。接着是启动子,也就是 RNA 聚合酶停靠、开始转录的那块停机坪。与启动子部分重叠的,是一小段叫操纵基因的 DNA。再往后,是三个结构基因 lacZ-lacY-lacA,一字排开。从启动子一直到这三个基因的整段,就是操纵子——一个开关,三个基因。
lacI 的产物,就是[[lac-repressor|乳糖阻遏蛋白]],一个只有一项本领的蛋白质:它认得操纵基因的序列,并紧紧攥住它,就像一把钥匙严丝合缝地配进一把锁。当阻遏蛋白夹在操纵基因上时,它就实打实地横跨在聚合酶本该走的那条路上。聚合酶仍能找到它的启动子,却没法往前走——阻遏蛋白是一道恰好停在基因起点的路障。这便是最纯粹的负控制:操纵子的静息状态是*关*,由一个蛋白质按住不放——除非有什么把它拽开。
诱导物:乳糖如何松开刹车
现在乳糖来到了肠道里。细胞是怎么察觉的?又是怎样借此把刹车踢开的?精妙之处就在这里。还记得那点从不严密的封锁里渗出的 β-半乳糖苷酶吗——也记得它的本职工作是*劈开*乳糖。作为一个小小的副反应,它还会把一点乳糖重排成一个与之极为相近的分子——异乳糖。异乳糖才是真正的信号,是那个诱导物。它是细胞如实发出的报告:乳糖确确实实在场,而且正进入机器之中。
异乳糖结合到阻遏蛋白上——不是结合在攥着 DNA 的那一部分,而是结合在另一个独立的口袋里。这正是你在蛋白质那一级见过的别构把戏:在一处结合,会把蛋白质另一处的形状重塑。当异乳糖嵌进去,阻遏蛋白攥住 DNA 的那个表面便改了形,握不住操纵基因了。刹车松开,路障飘走,RNA 聚合酶得以放开奔跑,lacZ-lacY-lacA 作为一条 mRNA 倾泻而出。更多的泵、更多的酶、更多的乳糖涌进来——操纵子已经因应它自己的底物,把自己打开了。这样控制的系统——平时关着,直到一个信号把它打开——就是可诱导系统。
第二层:还要顾及葡萄糖
如果阻遏就是故事的全部,那么只要周围有乳糖,操纵子就会打开——到此为止。可别忘了细胞真正的偏好:葡萄糖优先。若两种糖都在,聪明的做法是完全无视乳糖、先吃省事的葡萄糖,直到葡萄糖耗尽,才转去用乳糖。光靠移走阻遏蛋白做不到这一点;它只回答了“乳糖在不在?”这个问题。第二层独立的控制,回答的是另一个问题:“葡萄糖是不是稀缺了?”这就是[[catabolite-repression|分解代谢物阻遏]],它走的是正控制,而非负控制。
细胞并不直接测量葡萄糖。它转而备着一种像“反向温度计”的小分子——环腺苷酸(cAMP):葡萄糖充裕时,cAMP 维持得很低;葡萄糖紧缺时,cAMP 便升高。所以 cAMP 其实是一个“饥饿信号”,恰好在省事的食物没了的时候爬升。一个叫 CAP 的蛋白质(分解代谢物激活蛋白,也写作 CRP)是它的读取者。CAP 单凭自己什么也做不成;但 cAMP 结合 CAP,把它重塑——又是别构——成一种能攥住乳糖启动子上游紧邻位点的构型。
一旦 cAMP-CAP 这对搭档结合在启动子旁,它做的事与阻遏蛋白恰好相反:它*帮忙*。乳糖启动子本身是一块孱弱的停机坪——RNA 聚合酶只能松松地攥着它,于是即便阻遏蛋白已经走开,转录依然慢吞吞。结合在上游紧邻处的 CAP,伸过手去与聚合酶友好接触,把它招募过来,并把 DNA 弯折,好让它稳稳坐住。有了 CAP 相助,启动子便从孱弱变得强劲,转录轰然而起。这就是正控制:一个细胞必须放置在那里、才能换来高速率的激活蛋白。撤掉 CAP,操纵子就只剩噗噗作响——哪怕乳糖已经把阻遏蛋白清走。
拼到一起:一个由分子做成的逻辑门
现在退后一步,看这两层同时运作,因为合在一起,它们算出了一个真正的决定。阻遏蛋白问“乳糖在不在?”,CAP 问“葡萄糖是不是稀缺了?”,唯有当*两个*答案都是“是”时,操纵子才会强力转录。任何其它情形,它都安静着。用电子学的话来说,乳糖操纵子是一个“与”门(AND 门):唯有输入一与输入二都满足,输出才为高。一团蛋白质加上几粒糖,没有神经系统,也没有说明书,行为却恰如一个逻辑电路——这就是藏在一只细菌的午餐里、令人屏息的一课。
Layer 1 (NEGATIVE): lac repressor on operator -> blocks polymerase
lactose present -> allolactose pulls repressor OFF -> block lifted
Layer 2 (POSITIVE): glucose scarce -> cAMP high -> cAMP-CAP binds
cAMP-CAP beside promoter -> recruits polymerase -> strong transcription
TRUTH TABLE glucose HIGH glucose LOW
---------------------------------------------------------
lactose ABSENT off (repressed) off (repressed)
lactose PRESENT barely on ON (full blast)
=> transcribe strongly only when lactose PRESENT AND glucose SCARCE对这张整洁的表格,要做一处诚实的修正。左下那一格——乳糖在场、葡萄糖仍高——并非死寂一片;它是“勉强开着”,因为阻遏蛋白走了,但 CAP 没来帮忙,于是孱弱的启动子只噗噗作响。而那条著名的二次生长曲线——同时给大肠杆菌两种糖,它会先把葡萄糖吃光、停顿一下、再转去用乳糖——其背后的驱动并不只有 CAP:葡萄糖还会扼制乳糖泵(这个效应叫诱导物排斥)。干净的“与”门是正确的思维模型,也确实是大部分的真相——但真实的细菌会在其上叠加额外的微妙,一如生命系统总是如此。
为何这一个例子教会了整个领域
值得停下来想想:为何是乳糖操纵子、而非其它某个基因,成了奠基的故事。1960 年代初,雅各布(François Jacob)与莫诺(Jacques Monod)并没有盯着分子看——那时他们还看不见分子。他们做的是遗传学:用突变去打坏这个系统,再看哪里出了岔。lacI 上的一处突变,造出一种细胞,它总在不停地造酶、再也关不掉——指向一个缺失的刹车。操纵基因上的一处突变,造成同样的后果,却只影响位于它自己那条 DNA 分子上的基因——指向刹车的停靠点。从这些巧妙的杂交里,他们*推断*出了阻遏蛋白、操纵基因和诱导物,比任何人把它们纯化出来都早了好几年。这一番抽象的推理,日后被证明在物理上分毫不差,正是生物学最了不起的一次印证。
乳糖操纵子真正交付的,不只是一个开关,而是一套*语法*——一套零件的词汇(一个调控蛋白、一处它认得的 DNA 位点、一个改变蛋白质形状的小分子信号),后来证明这套零件无处不在地反复出现。紧接着的下一篇就把极性翻转:色氨酸操纵子用同样的零件,却是镜像的——一个平时*关着*、直到信号把它*打开*的阻遏蛋白——好在产物充裕时把一条通路关停。真核的基因控制——你会在下一级抵达——把操纵子换成散布各处的增强子,并在每个启动子上堆叠多得多的蛋白质,可它仍是用同一套字母拼成的:蛋白质读取 DNA,小信号重塑蛋白质。