一場演出的三幕
到現在為止,演員你都見過了。你知道轉錄把某個基因的 DNA 抄成 RNA,知道RNA 聚合酶是動筆的那台機器,知道它讀的是模板鏈而不是編碼鏈,也知道它合成 RNA 總是沿 5′ 到 3′ 的方向。這一篇不再點名演員,而是看著他們幹活——它跟隨一個聚合酶分子走完一次完整的抄寫,從它認定一個基因的那一刻,到它鬆手的那一刻。整場演出自然分成三幕:起始(把頭開起來)、延伸(平穩的中段)、和終止(知道何時停下)。
動筆之前,先把尺度定下來會有幫助。這三幕的難度懸殊得離譜。起始緩慢、繁瑣、又被嚴密管控——它可能要試上幾秒到幾分鐘,而細胞幾乎所有關於一個基因要不要被啟用的決定,都在這裡做出。延伸則相反,又快又幹練:細菌聚合酶一旦轉起來,每秒添加幾十個核苷酸,一口氣抄上幾千個鹼基不帶停的。終止短暫卻果斷——一個乾淨的句號,界定轉錄本在哪裡結束。整篇我會反覆借用一個畫面:一位抄寫員,必須在一本大書裡找到正確的那一頁、落入書寫的節奏,然後知道該把筆放下。
第一幕——起始:找到起點,磕絆著啟動
起始從一場搜尋開始。一個基因組有數百萬個鹼基對那麼長,化學性質又相當均一,所以聚合酶必須找出那寥寥幾個標記著基因起點的鹼基。在細菌裡,完整的酶(核心加上一個可替換的西格瑪因子)沿 DNA 滑動、碰撞,直到西格瑪因子認出一個啟動子——那塊緊靠上游的路牌,寫著「從這裡、在這條鏈上、朝這個方向開始」。啟動子你在上一篇裡見過了;這裡關鍵的新觀念是:找到它正是整個過程中限速的關卡。下游的一切都很快;時間都花在這第一步上。
聚合酶一旦停靠在啟動子上,在它能寫出哪怕一個字母之前,必須先發生兩件事。它先落座在閉合的雙螺旋上——這個狀態叫*閉合複合物*,此時 DNA 仍完全合攏。接著它把兩條鏈在一小段上撬開,約十幾個鹼基對,露出模板——即*開放複合物*,也叫轉錄泡。直到此刻,催化位點才夠得著模板鹼基。酶把頭兩個進來的核糖核苷酸對著模板排好、連起來,開始建造 RNA。按慣例,被抄的第一個鹼基編號為 +1,即轉錄起始位點;它之前(朝啟動子方向)的鹼基叫「上游」、記負數,它之後的鹼基叫「下游」。
下面這個意外,初學者很少料到:開頭並不是一錘定音的乾淨事件。當聚合酶還緊扣在啟動子上時,它往往會*結巴*——它造出一條幾個核苷酸的短 RNA、任其滑脫、然後再來一次,一遍又一遍,就像一個作者把開頭的廢稿一張張揉掉。這種浪費的撲騰叫做[[abortive-initiation-and-promoter-clearance|流產式起始]]。酶不情願鬆開它對啟動子的緊握,於是把下游 DNA 往裡搓,好在不移動的情況下繼續造 RNA——而那些小轉錄本大多散掉了。直到某一條轉錄本長得夠長(約 8 到 12 個核苷酸),酶才終於掙脫它對西格瑪因子和啟動子的把持,這一事件叫做啟動子逃逸或*啟動子清離*。這次逃逸,才是「只是在試」與「真的在轉錄」之間真正的門檻。
第二幕——延伸:讀一個鹼基,加一個鹼基,往前滑
把啟動子甩在身後,聚合酶便放鬆進入延伸那種平穩的節奏。在細菌裡,西格瑪因子此刻脫落(它只是用來找起點的),留下更精簡的核心酶去做長程抄寫。把這台酶想像成一個沿基因滑行的移動氣泡:它前方的雙螺旋被解開,露出新鮮的模板,它後方的兩條 DNA 鏈重新合攏,造好的 RNA 則剝離出來。這個泡不會變大——它在*行走*,前方打開新 DNA 的速度,恰好等於後方合攏舊 DNA 的速度,是一台自成一體、隨身帶著自己那一小片熔開 DNA 的機器。
氣泡內部,化學反應像鐘錶一樣重複。每走一步,酶讀取下一個模板鹼基,讓一個匹配的核糖核苷三磷酸(ATP、GTP、CTP 或 UTP)對著它試配——A 與模板的 T 配成 U、G 與 C 配,依此類推——若配得上,就在增長中的 RNA 的 3′ 端鍛造一個磷酸二酯鍵,釋放出兩個磷酸作為能量來源。然後整台酶恰好往前棘進一個鹼基,再重複。最新合成的一小段 RNA,約 8 到 9 個核苷酸,在脫離之前與模板保持配對、構成一段 RNA-DNA 雜合鏈;轉錄本其餘部分則拖在後面。而且很快——細菌聚合酶大約每秒能處理幾十個核苷酸。
moving ---> bubble travels along the gene
rewound DNA | transcription bubble | DNA to be read
============= ( unwound, ~13 bp open ) =================
3'...A T G C [ T A C G G A T ] G C A...5' <- template (read 3'->5')
| | | | | |
5'...U A U G C C U-OH (3' growing end) <- new RNA
============= =================
(re-zipped) RNA peels off here (still paired)延伸並非完美無瑕,它也不假裝如此。聚合酶只帶著*中等*的校對能力:若它錯加了一個鹼基,它能暫停、倒退一步、剪掉那個出錯的末端,再重新嘗試。這把出錯率削減到大約每一萬到十萬個鹼基出一次錯——明顯比 DNA 複製的近乎完美要馬虎。而這種鬆懈完全可以接受,理由很誠實、值得記住:一條 RNA 副本是用完即棄、且成批製造的,所以幾千條裡有一條出瑕疵不算災難;而複製錯誤卻會被每一個後代細胞繼承。細胞把它的精確度預算花在錯誤一旦發生便無可挽回的地方。
第三幕——終止:細菌停下來的兩種方式
知道何時停下,與知道何時開始同樣要緊。沒有一個可靠的句號,聚合酶就會一頭衝進下一個基因、再下一個,造出一條龐大纏結、毫無用處的轉錄本。終止就是細胞在句末點下的那個句號:讓聚合酶釋放它的 RNA、放開 DNA、就此收手的信號與機制。細菌用兩種不同的方式解決這個問題,兩種都值得一看,因為它們展示了同一個目標如何被截然不同的花招所達成。
第一種是內在終止,也叫不依賴因子的終止,因為它不需要任何額外的蛋白——停止信號就寫在 RNA 自身裡。當聚合酶轉錄到某一特定段落時,剛造好的 RNA 含有一段自身互補、富含 GC 的序列,它會立刻自我回折、疊成一個緊密的髮夾(莖環)。緊跟在髮夾之後是一串約六個或更多的尿嘧啶,於是 RNA 的 3′ 端只靠弱弱的 rU-dA 鹼基對繫在模板上。這一組合對「抓握」是致命的:髮夾拉扯、動搖聚合酶,而那些孱弱的 U-A 配對恰好讓 RNA 滑脫。酶停頓,RNA 剝離,轉錄結束。無需外援——轉錄本自帶停止牌。
第二種是[[rho-dependent-termination|依賴 Rho 的終止]],它確實需要一個幫手:一種環狀蛋白,叫 Rho。Rho 在一處特定的著陸區扣住正在增長的 RNA,然後沿轉錄本追趕聚合酶,借助 ATP 把自己沿 RNA 拉過去——想像一個奔跑的人衝刺去趕一列火車。與此同時,聚合酶在前面跑,但會週期性地暫停(往往在一個類似終止子的序列處)。當 Rho 追上一個停頓的聚合酶時,它把 RNA-DNA 雜合鏈撬開,迫使轉錄本鬆脫。結果與髮夾那條路相同——RNA 被釋放、酶被解放——但靠的是一個主動追捕聚合酶的蛋白,而不是 RNA 裡的一道摺疊。
退一步——整個過程的形狀
- 搜尋並結合:聚合酶(在細菌裡帶著西格瑪因子)沿 DNA 掃描,認出一個啟動子——這是緩慢、限速、受到重重調控的一步。
- 打開並起頭:它熔出一個小氣泡,露出模板,連上頭幾個核苷酸——磕磕絆絆地經歷流產式起始,直到終於逃離啟動子。
- 一路滾動:此刻進入延伸,氣泡向前行進,按 3′→5′ 讀取、按 5′→3′ 寫出 RNA,每秒幾十個鹼基,後方重新合攏 DNA,並做中等程度的校對。
- 停下並釋放:到了終點便終止——靠內在的髮夾加尿嘧啶信號,或靠 Rho 蛋白追上酶——把造好的轉錄本放出去。
在你繼續向上攀登之前,有兩點誠實的提醒。其一,真核生物並不完全照這樣運作。它們的起始繁複得多——一群通用轉錄因子和一個前起始複合物必須先組裝好,RNA 聚合酶 II 才能開始——而它們的終止則相對*草率*:Pol II 沒有乾淨俐落的髮夾停止牌,常常在資訊真正的末端之後再跑幾百個鹼基,其終止與切割、加尾 RNA 掛鉤,而非繫於一個俐落的信號。上面那個乾淨的三幕故事是細菌的版本;把它當作最清晰的範例,而不是一張普適的藍圖。
其二,別被這乾淨的三幕框架騙了,以為這三幕分量相等、彼此獨立。調控壓倒性地存在於起始——激活蛋白、阻遏蛋白、西格瑪因子,以及(在真核生物中)轉錄因子,全都把力氣堆在「到底開不開始」這個決定上,正因如此,這一階段才是細胞調控基因表達的主開關。延伸和終止大多只是機器按部就班地走完流程,儘管即便它們也留有調控的餘地(可以讓聚合酶暫停,或提早觸發終止以把轉錄本截短)。掌握了這三個階段,你就為下一級階梯的問題做好了準備:當聚合酶把原始 RNA 放掉*之後*,它會經歷什麼。