細菌只有一台機器,真核生物有三台
在上一篇裡,你看著一個細菌轉錄一個基因。它的配置很精簡:單單一種 RNA 聚合酶包辦一切活計,而它找到基因的辦法,是借來一個可替換的亞基——σ 因子——由它讀取啟動子,等轉錄一旦開跑就鬆手離開。一個核心酶、一個嚮導蛋白,細胞就上路了。本篇帶你跨過原核—真核的分界,去看一個有細胞核的細胞如何做同樣的化學反應,只是要繁複得多——也去看為什麼這些額外的機器並非官僚式的累贅,而是換取控制所付的代價。
第一個意外是:真核生物並不只有一種 RNA 聚合酶——它們有三種,每一種都是專門轉錄某一類基因的「專才」。聚合酶 I(Pol I)轉錄龐大的核糖體 RNA 基因——也就是那些將構成核糖體主體的大宗 RNA。聚合酶 II(Pol II)把所有編碼蛋白質的基因轉錄成信使 RNA(mRNA),外加許多調控性 RNA;它是我們最關心的一種,因為 mRNA 正是那份會被翻譯成蛋白質的工作副本。聚合酶 III(Pol III)則轉錄那些短小的「家務」RNA:轉運 RNA 以及細胞需要大量備用的其他小 RNA。三種酶、三份崗位說明書——這套分工,就是三聚合酶系統。
EUKARYOTIC RNA POLYMERASES -- three specialists
-------------------------------------------------
Pol I --> ribosomal RNA (rRNA) the bulk of ribosomes
Pol II --> messenger RNA (mRNA) protein-coding genes
+ many regulatory RNAs
Pol III --> transfer RNA (tRNA) + other small RNAs
(a bacterium does ALL of this with ONE polymerase)Pol II 自己找不到基因
這就是第二個重大差異,也是本篇的核心。細菌的聚合酶自帶尋基因的「嚮導」——σ 因子。真核生物的 Pol II 沒有這種東西——光靠它自己,它認不出啟動子、撐不開 DNA、也開不了工。它是一台出色的「書寫引擎」,卻完全不知道從哪兒落筆。為了把它安放到一個基因上,細胞要組裝起一組各自獨立的蛋白質,叫做[[tata-box-and-general-transcription-factors|通用轉錄因子]](GTF)。稱其「通用」,是因為幾乎每一個 Pol II 基因上用的都是這同樣的幾個,而與之相對的是我們將在後面幾階裡見到的、針對特定基因的調控因子。
許多 Pol II 啟動子,在轉錄起點稍稍上游的位置,帶有一個短小、可辨認的地標:TATA 框——一段富含 T 和 A 的 DNA,常寫作 5'-TATAAA-3'。由於 A-T 鹼基對只靠兩個氫鍵維繫、而 G-C 對有三個,一段富含 T 和 A 的區域便是整個基因上最容易把兩條鏈撬開的地方——這正是你在起跑線上想要的。一個專門的蛋白質會夾住 TATA 框、把 DNA 急劇彎折,插下一面寫著「在此開工」的旗幟。不過要老實交代它的局限:並非每個基因都有 TATA 框。許多啟動子、尤其是「家務」基因,改用別的地標;最好把 TATA 框當作課本上最乾淨的範例,而不是一條放之四海皆準的規則。
一塊一塊地搭起前起始複合物
通用轉錄因子和 Pol II 並不是作為一台造好的機器一同到場的。它們按大致固定的順序,在啟動子上逐件組裝,每一件都為下一件鋪好落腳點,直到整套結構——Pol II 加上它的那些 GTF,端端正正地停在起點上方——搭建完成。這套組裝好的結構,就是[[pre-initiation-complex|前起始複合物]](PIC)。可以把它想成這樣的區別:一個獨自在街上亂轉的司機,與一個司機、領航員、點火鑰匙、發令員全都在起跑線上各就各位——只有這個組裝齊備的「團隊」才真能開跑。
- 一個 TATA 結合蛋白落到 TATA 框上,把 DNA 折出一個彎,標定位置。(在沒有 TATA 框的啟動子上,則由別的因子來完成等效的「插旗」。)
- 更多通用轉錄因子依次停靠到這個錨點上,在啟動子上搭起一個有序的平台。
- Pol II 被招募進這個平台,精確地停在起點上方——前起始複合物至此組裝完成。
- 一個具有解旋酶活性的因子把一小段 DNA 解旋開來,撐出一個轉錄泡;另一個則給 Pol II 的「尾巴」加上磷酸基,將它放行。
- Pol II 甩開大部分 GTF,沿基因向前推進,把「發射團隊」留在原地準備下一輪啟動。
還有一個至關重要的角色,它正好解釋了真核生物為什麼要費這麼大周章。一座由蛋白質構成的大「橋」,叫作[[mediator-complex|中介體複合物]],橫在 Pol II 與那些結合在遠處的、針對特定基因的調控蛋白之間。當一個激活因子扣住幾千個鹼基對開外的一個增強子時,DNA 成環把它拉近,中介體便把那條「把我打開」的訊息轉達給前起始複合物——幫助它組裝得更快、點火得更頻繁。中介體就是那條讓遠方信號得以抵達起跑線的「線路」。細菌基因組緊湊、調控因子又直接,根本沒有這種東西。
轉錄與加工,攜手並進
這裡還有一個細菌從未遇到的轉折。細菌沒有細胞核,所以它的核糖體在一條 mRNA 還正在被轉錄的時候,就已經開始翻譯了。真核生物卻把 DNA 圍在細胞核裡,而 Pol II 造出的原始轉錄本——前體 mRNA——還不是一份成品訊息。它必須在前端加帽、在尾端被修剪並接上尾巴、還要把內部那些非編碼的片段剪掉,才能離開細胞核。這套編輯,就是[[pre-mrna-processing|前體 mRNA 加工]],也正是下一階的全部主題。
精妙之處——也是相對晚近才認識到的一點——在於:這套加工並不是轉錄本事後另行造訪的一座獨立工廠。它在很大程度上是「邊轉錄邊進行」的:隨著 Pol II 一路爬行,那條當初被加上磷酸基以放行它的「尾巴」,如今成了一張移動的工作台,載著加帽、剪接和加尾的各路班組,把每一段剛冒出來的新 RNA 即時交到它們手上。轉錄與加工是耦合在一起的——是一項連續、協調的作業,而不是流水線上的兩個工位。聚合酶不只是一台複印機;它是一個組織起下游一切的移動平台。
為什麼這一身繁複正是通往調控的門戶
退後一步,所有這些額外機器的用意便清晰起來。每多出的一個部件——專門的聚合酶、那一委員會的通用因子、中介體這座橋、那個要靠組裝整套複合物才成立的起點——都是細胞可以抓住、用來決定一個基因是否點火的又一個「把手」。細菌那台單憑 σ 因子驅動的聚合酶,能提供的這類把手寥寥無幾;而真核生物那個由許多部件組成的起始過程,給了它幾十個。這正是為什麼轉錄是細胞主要的控制點:與其造出一份副本再去銷毀它,遠不如壓根不開始抄寫來得省;所以細胞把它的決策集中在這裡——在起始這一步。
而這些把手並非各自為政。回想染色質那一篇:同一個啟動子,既可能被深埋在壓得緊緊的異染色質裡,也可能在常染色質中被攤開;前起始複合物只能在 DNA 可觸及的地方組裝。把打包狀態疊加到增強子、激活因子和中介體之上,你就得到了組合控制——眾多輸入匯聚成起點處那個唯一的「是」或「否」。正是憑著這一套,一個三聚合酶系統加上約兩萬個編碼蛋白質的基因,才能從完全相同的基因組裡造出一個肝細胞和一個神經元。你剛剛見到的這一身繁複,並不是演化挑剔出來的偶然;它是後面幾階中所有調控得以書寫其上的「底料」。