细菌只有一台机器,真核生物有三台
在上一篇里,你看着一个细菌转录一个基因。它的配置很精简:单单一种 RNA 聚合酶包办一切活计,而它找到基因的办法,是借来一个可替换的亚基——σ 因子——由它读取启动子,等转录一旦开跑就松手离开。一个核心酶、一个向导蛋白,细胞就上路了。本篇带你跨过原核—真核的分界,去看一个有细胞核的细胞如何做同样的化学反应,只是要繁复得多——也去看为什么这些额外的机器并非官僚式的累赘,而是换取控制所付的代价。
第一个意外是:真核生物并不只有一种 RNA 聚合酶——它们有三种,每一种都是专门转录某一类基因的“专才”。聚合酶 I(Pol I)转录庞大的核糖体 RNA 基因——也就是那些将构成核糖体主体的大宗 RNA。聚合酶 II(Pol II)把所有编码蛋白质的基因转录成信使 RNA(mRNA),外加许多调控性 RNA;它是我们最关心的一种,因为 mRNA 正是那份会被翻译成蛋白质的工作副本。聚合酶 III(Pol III)则转录那些短小的“家务”RNA:转运 RNA 以及细胞需要大量备用的其他小 RNA。三种酶、三份岗位说明书——这套分工,就是三聚合酶系统。
EUKARYOTIC RNA POLYMERASES -- three specialists
-------------------------------------------------
Pol I --> ribosomal RNA (rRNA) the bulk of ribosomes
Pol II --> messenger RNA (mRNA) protein-coding genes
+ many regulatory RNAs
Pol III --> transfer RNA (tRNA) + other small RNAs
(a bacterium does ALL of this with ONE polymerase)Pol II 自己找不到基因
这就是第二个重大差异,也是本篇的核心。细菌的聚合酶自带寻基因的“向导”——σ 因子。真核生物的 Pol II 没有这种东西——光靠它自己,它认不出启动子、撑不开 DNA、也开不了工。它是一台出色的“书写引擎”,却完全不知道从哪儿落笔。为了把它安放到一个基因上,细胞要组装起一组各自独立的蛋白质,叫做[[tata-box-and-general-transcription-factors|通用转录因子]](GTF)。称其“通用”,是因为几乎每一个 Pol II 基因上用的都是这同样的几个,而与之相对的是我们将在后面几阶里见到的、针对特定基因的调控因子。
许多 Pol II 启动子,在转录起点稍稍上游的位置,带有一个短小、可辨认的地标:TATA 框——一段富含 T 和 A 的 DNA,常写作 5'-TATAAA-3'。由于 A-T 碱基对只靠两个氢键维系、而 G-C 对有三个,一段富含 T 和 A 的区域便是整个基因上最容易把两条链撬开的地方——这正是你在起跑线上想要的。一个专门的蛋白质会夹住 TATA 框、把 DNA 急剧弯折,插下一面写着“在此开工”的旗帜。不过要老实交代它的局限:并非每个基因都有 TATA 框。许多启动子、尤其是“家务”基因,改用别的地标;最好把 TATA 框当作课本上最干净的范例,而不是一条放之四海皆准的规则。
一块一块地搭起前起始复合物
通用转录因子和 Pol II 并不是作为一台造好的机器一同到场的。它们按大致固定的顺序,在启动子上逐件组装,每一件都为下一件铺好落脚点,直到整套结构——Pol II 加上它的那些 GTF,端端正正地停在起点上方——搭建完成。这套组装好的结构,就是[[pre-initiation-complex|前起始复合物]](PIC)。可以把它想成这样的区别:一个独自在街上乱转的司机,与一个司机、领航员、点火钥匙、发令员全都在起跑线上各就各位——只有这个组装齐备的“团队”才真能开跑。
- 一个 TATA 结合蛋白落到 TATA 框上,把 DNA 折出一个弯,标定位置。(在没有 TATA 框的启动子上,则由别的因子来完成等效的“插旗”。)
- 更多通用转录因子依次停靠到这个锚点上,在启动子上搭起一个有序的平台。
- Pol II 被招募进这个平台,精确地停在起点上方——前起始复合物至此组装完成。
- 一个具有解旋酶活性的因子把一小段 DNA 解旋开来,撑出一个转录泡;另一个则给 Pol II 的“尾巴”加上磷酸基,将它放行。
- Pol II 甩开大部分 GTF,沿基因向前推进,把“发射团队”留在原地准备下一轮启动。
还有一个至关重要的角色,它正好解释了真核生物为什么要费这么大周章。一座由蛋白质构成的大“桥”,叫作[[mediator-complex|中介体复合物]],横在 Pol II 与那些结合在远处的、针对特定基因的调控蛋白之间。当一个激活因子扣住几千个碱基对开外的一个增强子时,DNA 成环把它拉近,中介体便把那条“把我打开”的讯息转达给前起始复合物——帮助它组装得更快、点火得更频繁。中介体就是那条让远方信号得以抵达起跑线的“线路”。细菌基因组紧凑、调控因子又直接,根本没有这种东西。
转录与加工,携手并进
这里还有一个细菌从未遇到的转折。细菌没有细胞核,所以它的核糖体在一条 mRNA 还正在被转录的时候,就已经开始翻译了。真核生物却把 DNA 围在细胞核里,而 Pol II 造出的原始转录本——前体 mRNA——还不是一份成品讯息。它必须在前端加帽、在尾端被修剪并接上尾巴、还要把内部那些非编码的片段剪掉,才能离开细胞核。这套编辑,就是[[pre-mrna-processing|前体 mRNA 加工]],也正是下一阶的全部主题。
精妙之处——也是相对晚近才认识到的一点——在于:这套加工并不是转录本事后另行造访的一座独立工厂。它在很大程度上是“边转录边进行”的:随着 Pol II 一路爬行,那条当初被加上磷酸基以放行它的“尾巴”,如今成了一张移动的工作台,载着加帽、剪接和加尾的各路班组,把每一段刚冒出来的新 RNA 即时交到它们手上。转录与加工是耦合在一起的——是一项连续、协调的作业,而不是流水线上的两个工位。聚合酶不只是一台复印机;它是一个组织起下游一切的移动平台。
为什么这一身繁复正是通往调控的门户
退后一步,所有这些额外机器的用意便清晰起来。每多出的一个部件——专门的聚合酶、那一委员会的通用因子、中介体这座桥、那个要靠组装整套复合物才成立的起点——都是细胞可以抓住、用来决定一个基因是否点火的又一个“把手”。细菌那台单凭 σ 因子驱动的聚合酶,能提供的这类把手寥寥无几;而真核生物那个由许多部件组成的起始过程,给了它几十个。这正是为什么转录是细胞主要的控制点:与其造出一份副本再去销毁它,远不如压根不开始抄写来得省;所以细胞把它的决策集中在这里——在起始这一步。
而这些把手并非各自为政。回想染色质那一篇:同一个启动子,既可能被深埋在压得紧紧的异染色质里,也可能在常染色质中被摊开;前起始复合物只能在 DNA 可触及的地方组装。把打包状态叠加到增强子、激活因子和中介体之上,你就得到了组合控制——众多输入汇聚成起点处那个唯一的“是”或“否”。正是凭着这一套,一个三聚合酶系统加上约两万个编码蛋白质的基因,才能从完全相同的基因组里造出一个肝细胞和一个神经元。你刚刚见到的这一身繁复,并不是演化挑剔出来的偶然;它是后面几阶中所有调控得以书写其上的“底料”。