真核生物的转录及其三种聚合酶

细菌只有一台机器，真核生物有三台

在上一篇里，你看着一个细菌转录一个基因。它的配置很精简：单单一种 RNA 聚合酶包办一切活计，而它找到基因的办法，是借来一个可替换的亚基——σ 因子——由它读取启动子，等转录一旦开跑就松手离开。一个核心酶、一个向导蛋白，细胞就上路了。本篇带你跨过原核—真核的分界，去看一个有细胞核的细胞如何做同样的化学反应，只是要繁复得多——也去看为什么这些额外的机器并非官僚式的累赘，而是换取控制所付的代价。

第一个意外是：真核生物并不只有一种 RNA 聚合酶——它们有三种，每一种都是专门转录某一类基因的“专才”。聚合酶 I（Pol I）转录庞大的核糖体 RNA 基因——也就是那些将构成核糖体主体的大宗 RNA。聚合酶 II（Pol II）把所有编码蛋白质的基因转录成信使 RNA（mRNA），外加许多调控性 RNA；它是我们最关心的一种，因为 mRNA 正是那份会被翻译成蛋白质的工作副本。聚合酶 III（Pol III）则转录那些短小的“家务”RNA：转运 RNA 以及细胞需要大量备用的其他小 RNA。三种酶、三份岗位说明书——这套分工，就是三聚合酶系统。

  EUKARYOTIC RNA POLYMERASES  --  three specialists
  -------------------------------------------------
   Pol I    -->  ribosomal RNA (rRNA)      the bulk of ribosomes
   Pol II   -->  messenger RNA (mRNA)      protein-coding genes
                 + many regulatory RNAs
   Pol III  -->  transfer RNA (tRNA)       + other small RNAs

  (a bacterium does ALL of this with ONE polymerase)

真核生物把转录的活分给三种专门的聚合酶；其中制造 mRNA 的 Pol II 是本篇的主角。

Pol II 自己找不到基因

这就是第二个重大差异，也是本篇的核心。细菌的聚合酶自带寻基因的“向导”——σ 因子。真核生物的 Pol II 没有这种东西——光靠它自己，它认不出启动子、撑不开 DNA、也开不了工。它是一台出色的“书写引擎”，却完全不知道从哪儿落笔。为了把它安放到一个基因上，细胞要组装起一组各自独立的蛋白质，叫做[[tata-box-and-general-transcription-factors|通用转录因子]]（GTF）。称其“通用”，是因为几乎每一个 Pol II 基因上用的都是这同样的几个，而与之相对的是我们将在后面几阶里见到的、针对特定基因的调控因子。

许多 Pol II 启动子，在转录起点稍稍上游的位置，带有一个短小、可辨认的地标：TATA 框——一段富含 T 和 A 的 DNA，常写作 5'-TATAAA-3'。由于 A-T 碱基对只靠两个氢键维系、而 G-C 对有三个，一段富含 T 和 A 的区域便是整个基因上最容易把两条链撬开的地方——这正是你在起跑线上想要的。一个专门的蛋白质会夹住 TATA 框、把 DNA 急剧弯折，插下一面写着“在此开工”的旗帜。不过要老实交代它的局限：并非每个基因都有 TATA 框。许多启动子、尤其是“家务”基因，改用别的地标；最好把 TATA 框当作课本上最干净的范例，而不是一条放之四海皆准的规则。

一块一块地搭起前起始复合物

通用转录因子和 Pol II 并不是作为一台造好的机器一同到场的。它们按大致固定的顺序，在启动子上逐件组装，每一件都为下一件铺好落脚点，直到整套结构——Pol II 加上它的那些 GTF，端端正正地停在起点上方——搭建完成。这套组装好的结构，就是[[pre-initiation-complex|前起始复合物]]（PIC）。可以把它想成这样的区别：一个独自在街上乱转的司机，与一个司机、领航员、点火钥匙、发令员全都在起跑线上各就各位——只有这个组装齐备的“团队”才真能开跑。

一个 TATA 结合蛋白落到 TATA 框上，把 DNA 折出一个弯，标定位置。（在没有 TATA 框的启动子上，则由别的因子来完成等效的“插旗”。）
更多通用转录因子依次停靠到这个锚点上，在启动子上搭起一个有序的平台。
Pol II 被招募进这个平台，精确地停在起点上方——前起始复合物至此组装完成。
一个具有解旋酶活性的因子把一小段 DNA 解旋开来，撑出一个转录泡；另一个则给 Pol II 的“尾巴”加上磷酸基，将它放行。
Pol II 甩开大部分 GTF，沿基因向前推进，把“发射团队”留在原地准备下一轮启动。

还有一个至关重要的角色，它正好解释了真核生物为什么要费这么大周章。一座由蛋白质构成的大“桥”，叫作[[mediator-complex|中介体复合物]]，横在 Pol II 与那些结合在远处的、针对特定基因的调控蛋白之间。当一个激活因子扣住几千个碱基对开外的一个增强子时，DNA 成环把它拉近，中介体便把那条“把我打开”的讯息转达给前起始复合物——帮助它组装得更快、点火得更频繁。中介体就是那条让远方信号得以抵达起跑线的“线路”。细菌基因组紧凑、调控因子又直接，根本没有这种东西。

转录与加工，携手并进

这里还有一个细菌从未遇到的转折。细菌没有细胞核，所以它的核糖体在一条 mRNA 还正在被转录的时候，就已经开始翻译了。真核生物却把 DNA 围在细胞核里，而 Pol II 造出的原始转录本——前体 mRNA——还不是一份成品讯息。它必须在前端加帽、在尾端被修剪并接上尾巴、还要把内部那些非编码的片段剪掉，才能离开细胞核。这套编辑，就是[[pre-mrna-processing|前体 mRNA 加工]]，也正是下一阶的全部主题。

精妙之处——也是相对晚近才认识到的一点——在于：这套加工并不是转录本事后另行造访的一座独立工厂。它在很大程度上是“边转录边进行”的：随着 Pol II 一路爬行，那条当初被加上磷酸基以放行它的“尾巴”，如今成了一张移动的工作台，载着加帽、剪接和加尾的各路班组，把每一段刚冒出来的新 RNA 即时交到它们手上。转录与加工是耦合在一起的——是一项连续、协调的作业，而不是流水线上的两个工位。聚合酶不只是一台复印机；它是一个组织起下游一切的移动平台。

为什么这一身繁复正是通往调控的门户

退后一步，所有这些额外机器的用意便清晰起来。每多出的一个部件——专门的聚合酶、那一委员会的通用因子、中介体这座桥、那个要靠组装整套复合物才成立的起点——都是细胞可以抓住、用来决定一个基因是否点火的又一个“把手”。细菌那台单凭 σ 因子驱动的聚合酶，能提供的这类把手寥寥无几；而真核生物那个由许多部件组成的起始过程，给了它几十个。这正是为什么转录是细胞主要的控制点：与其造出一份副本再去销毁它，远不如压根不开始抄写来得省；所以细胞把它的决策集中在这里——在起始这一步。

而这些把手并非各自为政。回想染色质那一篇：同一个启动子，既可能被深埋在压得紧紧的异染色质里，也可能在常染色质中被摊开；前起始复合物只能在 DNA 可触及的地方组装。把打包状态叠加到增强子、激活因子和中介体之上，你就得到了组合控制——众多输入汇聚成起点处那个唯一的“是”或“否”。正是凭着这一套，一个三聚合酶系统加上约两万个编码蛋白质的基因，才能从完全相同的基因组里造出一个肝细胞和一个神经元。你刚刚见到的这一身繁复，并不是演化挑剔出来的偶然；它是后面几阶中所有调控得以书写其上的“底料”。