JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

真核生物的转录及其三种聚合酶

细菌靠一种 RNA 聚合酶加一个小帮手就能凑合。而真核生物动用三种不同的聚合酶,仅仅为了启动一个 mRNA 基因,就要召集起一个由蛋白质组成的“小委员会”——而正是这份繁复,构成了后续一切基因调控的根基。

细菌只有一台机器,真核生物有三台

在上一篇里,你看着一个细菌转录一个基因。它的配置很精简:单单一种 RNA 聚合酶包办一切活计,而它找到基因的办法,是借来一个可替换的亚基——σ 因子——由它读取启动子,等转录一旦开跑就松手离开。一个核心酶、一个向导蛋白,细胞就上路了。本篇带你跨过原核—真核的分界,去看一个有细胞核的细胞如何做同样的化学反应,只是要繁复得多——也去看为什么这些额外的机器并非官僚式的累赘,而是换取控制所付的代价。

第一个意外是:真核生物并不只有一种 RNA 聚合酶——它们有三种,每一种都是专门转录某一类基因的“专才”。聚合酶 I(Pol I)转录庞大的核糖体 RNA 基因——也就是那些将构成核糖体主体的大宗 RNA。聚合酶 II(Pol II)把所有编码蛋白质的基因转录成信使 RNA(mRNA),外加许多调控性 RNA;它是我们最关心的一种,因为 mRNA 正是那份会被翻译成蛋白质的工作副本。聚合酶 III(Pol III)则转录那些短小的“家务”RNA:转运 RNA 以及细胞需要大量备用的其他小 RNA。三种酶、三份岗位说明书——这套分工,就是三聚合酶系统

  EUKARYOTIC RNA POLYMERASES  --  three specialists
  -------------------------------------------------
   Pol I    -->  ribosomal RNA (rRNA)      the bulk of ribosomes
   Pol II   -->  messenger RNA (mRNA)      protein-coding genes
                 + many regulatory RNAs
   Pol III  -->  transfer RNA (tRNA)       + other small RNAs

  (a bacterium does ALL of this with ONE polymerase)
真核生物把转录的活分给三种专门的聚合酶;其中制造 mRNA 的 Pol II 是本篇的主角。

Pol II 自己找不到基因

这就是第二个重大差异,也是本篇的核心。细菌的聚合酶自带寻基因的“向导”——σ 因子。真核生物的 Pol II 没有这种东西——光靠它自己,它认不出启动子、撑不开 DNA、也开不了工。它是一台出色的“书写引擎”,却完全不知道从哪儿落笔。为了把它安放到一个基因上,细胞要组装起一组各自独立的蛋白质,叫做[[tata-box-and-general-transcription-factors|通用转录因子]](GTF)。称其“通用”,是因为几乎每一个 Pol II 基因上用的都是这同样的几个,而与之相对的是我们将在后面几阶里见到的、针对特定基因的调控因子。

许多 Pol II 启动子,在转录起点稍稍上游的位置,带有一个短小、可辨认的地标:TATA 框——一段富含 T 和 A 的 DNA,常写作 5'-TATAAA-3'。由于 A-T 碱基对只靠两个氢键维系、而 G-C 对有三个,一段富含 T 和 A 的区域便是整个基因上最容易把两条链撬开的地方——这正是你在起跑线上想要的。一个专门的蛋白质会夹住 TATA 框、把 DNA 急剧弯折,插下一面写着“在此开工”的旗帜。不过要老实交代它的局限:并非每个基因都有 TATA 框。许多启动子、尤其是“家务”基因,改用别的地标;最好把 TATA 框当作课本上最干净的范例,而不是一条放之四海皆准的规则。

一块一块地搭起前起始复合物

通用转录因子和 Pol II 并不是作为一台造好的机器一同到场的。它们按大致固定的顺序,在启动子上逐件组装,每一件都为下一件铺好落脚点,直到整套结构——Pol II 加上它的那些 GTF,端端正正地停在起点上方——搭建完成。这套组装好的结构,就是[[pre-initiation-complex|前起始复合物]](PIC)。可以把它想成这样的区别:一个独自在街上乱转的司机,与一个司机、领航员、点火钥匙、发令员全都在起跑线上各就各位——只有这个组装齐备的“团队”才真能开跑。

  1. 一个 TATA 结合蛋白落到 TATA 框上,把 DNA 折出一个弯,标定位置。(在没有 TATA 框的启动子上,则由别的因子来完成等效的“插旗”。)
  2. 更多通用转录因子依次停靠到这个锚点上,在启动子上搭起一个有序的平台。
  3. Pol II 被招募进这个平台,精确地停在起点上方——前起始复合物至此组装完成。
  4. 一个具有解旋酶活性的因子把一小段 DNA 解旋开来,撑出一个转录泡;另一个则给 Pol II 的“尾巴”加上磷酸基,将它放行。
  5. Pol II 甩开大部分 GTF,沿基因向前推进,把“发射团队”留在原地准备下一轮启动。

还有一个至关重要的角色,它正好解释了真核生物为什么要费这么大周章。一座由蛋白质构成的大“桥”,叫作[[mediator-complex|中介体复合物]],横在 Pol II 与那些结合在远处的、针对特定基因的调控蛋白之间。当一个激活因子扣住几千个碱基对开外的一个增强子时,DNA 成环把它拉近,中介体便把那条“把我打开”的讯息转达给前起始复合物——帮助它组装得更快、点火得更频繁。中介体就是那条让远方信号得以抵达起跑线的“线路”。细菌基因组紧凑、调控因子又直接,根本没有这种东西。

转录与加工,携手并进

这里还有一个细菌从未遇到的转折。细菌没有细胞核,所以它的核糖体在一条 mRNA 还正在被转录的时候,就已经开始翻译了。真核生物却把 DNA 围在细胞核里,而 Pol II 造出的原始转录本——前体 mRNA——还不是一份成品讯息。它必须在前端加帽、在尾端被修剪并接上尾巴、还要把内部那些非编码的片段剪掉,才能离开细胞核。这套编辑,就是[[pre-mrna-processing|前体 mRNA 加工]],也正是下一阶的全部主题。

精妙之处——也是相对晚近才认识到的一点——在于:这套加工并不是转录本事后另行造访的一座独立工厂。它在很大程度上是“边转录边进行”的:随着 Pol II 一路爬行,那条当初被加上磷酸基以放行它的“尾巴”,如今成了一张移动的工作台,载着加帽、剪接和加尾的各路班组,把每一段刚冒出来的新 RNA 即时交到它们手上。转录与加工是耦合在一起的——是一项连续、协调的作业,而不是流水线上的两个工位。聚合酶不只是一台复印机;它是一个组织起下游一切的移动平台。

为什么这一身繁复正是通往调控的门户

退后一步,所有这些额外机器的用意便清晰起来。每多出的一个部件——专门的聚合酶、那一委员会的通用因子、中介体这座桥、那个要靠组装整套复合物才成立的起点——都是细胞可以抓住、用来决定一个基因是否点火的又一个“把手”。细菌那台单凭 σ 因子驱动的聚合酶,能提供的这类把手寥寥无几;而真核生物那个由许多部件组成的起始过程,给了它几十个。这正是为什么转录是细胞主要的控制点:与其造出一份副本再去销毁它,远不如压根不开始抄写来得省;所以细胞把它的决策集中在这里——在起始这一步。

而这些把手并非各自为政。回想染色质那一篇:同一个启动子,既可能被深埋在压得紧紧的异染色质里,也可能在常染色质中被摊开;前起始复合物只能在 DNA 可触及的地方组装。把打包状态叠加到增强子、激活因子和中介体之上,你就得到了组合控制——众多输入汇聚成起点处那个唯一的“是”或“否”。正是凭着这一套,一个三聚合酶系统加上约两万个编码蛋白质的基因,才能从完全相同的基因组里造出一个肝细胞和一个神经元。你刚刚见到的这一身繁复,并不是演化挑剔出来的偶然;它是后面几阶中所有调控得以书写其上的“底料”。