JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

轉錄:寫出一份 RNA 副本

細胞究竟怎樣讀取一個基因,卻又始終不把那份珍貴的 DNA 從書架上取下來?它寫出一份 RNA 工作副本。來看一台分子機器如何找到起點、拉開雙螺旋、逐個字母地抄錄其中一條鏈,最後鬆手放開——由此產出細胞那條訊息的初稿。

為什麼非要抄一份?工作便條的意義

上一篇留給我們一組張力:基因組裝著一切,可一本擱在書架上的書做不出飯來。細胞的答案,就是中心法則的第一步,從 DNA 到 RNA:與其把那份主檔案拖到車間去,細胞只把此刻真正需要的那一個基因抄出一份短小、用完即棄的副本。這個抄錄過程就是轉錄,而這個動作恰如其字面所言——你抄錄一段文字,是把它在新的載體上重新寫一遍,而不是把那一頁從原書裡撕下來。

有兩點讓這一招顯得高明,而非浪費。其一,原始 DNA 始終不離開細胞核(或細胞內部)的安全地帶——檔案保持原封不動,讓用完即棄的副本到機器所在之處去幹粗活。其二,細胞可以為一個忙碌的基因抄出*許多*份副本,而對一個難得用到的基因只抄一份,於是這個抄錄步驟本身就成了控制每種產物造多少的「音量旋鈕」。一份 DNA 藍圖能甩出成千上萬張一模一樣的便條,而每張便條在任務完成後都可以扔掉。

機器與它的起點:RNA 聚合酶遇上啟動子

做這件「寫」的活兒的機器,是 RNA 聚合酶——一種蛋白質複合體,它的全部職責就是沿著 DNA 爬行,把一份 RNA 副本一個字母一個字母地串起來。(它是你在複製那一級裡認識的 DNA 聚合酶的表親;兩者都讀取一條 DNA 模板、造出一條新鏈,只不過這一位寫的是 RNA。)它面對的深層難題,是*找到起點*。你的 DNA 長達數十億個字母,某個基因就埋在其中的某處。這台機器要怎樣從浩如煙海的文本裡,知道某個基因從哪裡起頭——又該抄成千上萬個基因中的哪一個?

答案,是寫在每個基因上游 DNA 裡的一個地標:啟動子啟動子並不屬於那條訊息本身;它是一段短短的特徵序列,意思是「基因從這裡開始,朝這個方向讀」。把它想成一道菜譜頂端的標題和起跑箭頭。RNA 聚合酶(常常由一些輔助蛋白引導著)識別出某個啟動子、停靠上去,而這一結合既把機器*定位*在正確的位置,又給它*指明*了正確的方向。沒有啟動子,就沒有轉錄——這也正是為什麼,當細胞要決定開啟哪些基因時,啟動子會成為一個總開關。

抄哪一條鏈——以及那個會移動的氣泡

這裡有一個幾乎絆倒所有人的點,所以我們慢慢來。DNA 有兩條鏈,彼此反向平行,靠鹼基配對結合在一起。RNA 聚合酶*只把其中一條*當作樣板來讀——那就是模板鏈(也叫反義鏈)。它讀這條模板,鋪下與之配對的 RNA 字母。而*另一條*、被它忽略的鏈,是編碼鏈(或稱有義鏈)——妙就妙在這裡:正因為鹼基配對,那份 RNA 副本最終讀起來幾乎和這條編碼鏈一模一樣,只是把 T 換成了 U。所以,機器從不碰的那條鏈,恰恰是訊息在序列上與之相像的那條。

  coding strand (sense)    5'- A T G  C G  A  T  T  C -3'   <- RNA reads like this (U for T)
                               | | |  | |  |  |  |  |
  template strand (antisense) 3'- T A C  G C  T  A  A  G -5'   <- the machine actually reads THIS
                                  |
                                  v   RNA polymerase pairs A->U, C->G, G->C, T->A
  RNA transcript           5'- A U G  C G  A  U  U  C ...     (matches coding strand, T -> U)
機器讀的是模板鏈,但產出的 RNA 卻與編碼鏈相符(其中 U 取代了 T)。「編碼鏈」與「模板鏈」的身份是逐個基因決定的,而非整條鏈固定不變:螺旋上更遠處的另一個基因,可能反過來用對面那條鏈當模板。

要讀取一條模板,機器必須先把兩條鏈撬開——DNA 的字母是藏在雙螺旋*內側*的,配著對時根本讀不到。於是 RNA 聚合酶在局部拉開約十幾個鹼基對,打開一個小小的轉錄氣泡:一小段兩條 DNA 鏈彼此分開、模板暴露在外的區域。美妙之處在於,這個氣泡會跟著機器移動。聚合酶一邊往前走,一邊在它前緣解開新的 DNA,又讓身後的兩條鏈重新合攏,所以任何時刻都只開著一扇很小的窗。螺旋只被打開到剛好夠用、且恰在需要之處,隨即又被重新拉合——檔案絕不會被危險地長時間散開。

起始、延伸、終止

和大多數分子過程一樣,轉錄分三幕展開:它必須開始、進行、停止。這些可不是官僚式的標籤——每一幕都在解決一個真實的難題。開始,是要*找對地方並下定決心*;進行,是要*又快又準地抄錄*;停止,是要*知道基因在哪裡結束並鬆手放開*。把這三幕走一遍,整個過程就會一下子拼合到一起。

  1. 起始。RNA 聚合酶攜同它的輔助蛋白,識別並鉗住啟動子,隨即打開轉錄氣泡的第一段。它不需要引子——與 DNA 聚合酶不同,它能從零開始一條 RNA 鏈。一旦鋪下頭幾個 RNA 字母,它便下定決心、掙脫啟動子,把那個起始訊號留在身後。
  2. 延伸。機器此刻沿著模板平穩滑行,氣泡隨之移動。每走一步,它就讀出模板上的下一個鹼基,添上與之相配的 RNA 字母(A 配 U、G 配 C,依此類推),讓鏈朝一個方向生長,速度大約是每秒幾十個字母。新造出的 RNA 在身後剝離開來,與此同時 DNA 重新合攏。
  3. 終止。當機器抵達 DNA 裡寫好的一個停止訊號時,它便釋放出造好的 RNA、從模板上脫落下來,氣泡也徹底合上。DNA 被原樣留下——毫髮無損,隨時可以再被抄錄一次——而一條嶄新的 RNA 鏈則自由地飄走了。

最後飄走的那條鏈,就是初級轉錄本——直接從基因上抄下來的、未經加工的初稿 RNA。這三幕的合稱,起始、延伸與終止,值得記牢,因為當你走到下一級的翻譯時,*同樣這一組三幕*還會再度登場。不過,有一處簡化要誠實交代:在真核生物裡,這是一樁需要許多輔助蛋白參與、受到引導和調控的事,而產出的初稿幾乎總是還要經過編輯才算就緒——這正是下一篇要講的內容。

為什麼是 RNA,而不是更多 DNA?工作副本天生不同

把 DNA 抄成更多 DNA,看上去會更省事。可細胞偏偏要抄成 RNA,而這兩者之間的差異,恰恰正是讓 RNA 成為一份好的*用完即棄的工作副本*、而非第二份檔案的原因。有三處差異要緊。RNA 在 DNA 用胸腺嘧啶(T)的地方改用鹼基尿嘧啶(U)——化學上幾乎相同,卻是一個把 RNA 標記為 RNA 的記號。RNA 的糖是核糖,比 DNA 的脫氧核糖多帶一個氧;這個多出來的氧讓 RNA 在化學上更活潑,因而也更不穩定。還有,RNA 通常是單鏈的,而 DNA 是那條著名的雙螺旋。

請把這些特性讀成優點,而非缺陷。DNA 是為了*持久*而生的——用兩條鏈,好讓信息有備份、受保護;用穩定的糖,好讓它伴隨一生而不壞。RNA 則是為了*用完即棄*而生的——單鏈,所以它靈活輕便,能被自由地讀取和摺疊;不那麼穩定,所以一旦訊息送達,它便不會賴著不走、堆在細胞裡礙事。一份短命、易降解的副本,正是按需工作便條所需要的:造出來、用一用、讓它分解掉。這份脆弱,本身就是關鍵所在。

把它串起來:一份初稿,而非定稿

退後一步,把整場戲重放一遍。RNA 聚合酶找到一個啟動子並鎖定上去(起始);它撬開一個會移動的轉錄氣泡、讀取模板鏈,鋪下與編碼鏈相符、只是以 U 代 T 的 RNA 字母(延伸);它撞上一個停止訊號,釋放出自己的產物,讓身後的 DNA 重新合攏(終止)。飄走的,是一條單鏈的 RNA 初級轉錄本——某個基因一份嶄新、用完即棄的副本,而原件在整個過程中毫髮無損。

但請留意*初級*、或者說*初稿*這個詞。在真核生物裡,聚合酶產出的,還不是一條乾淨、可直接使用的訊息。它仍帶著一些必須被剪掉的片段,而且在它能安全地離開細胞核、被讀取之前,還需要加上保護性的帽子和尾巴。把它稱作基因組的初稿,在兩個方向上都是誠實的:它是這個基因一份貨真價實的副本,同時它又尚未完成。把這條未經加工的轉錄本,編輯成一條成熟、可用的信使 RNA的過程,是下一篇的主題——RNA 加工那套出人意料的「剪刀加膠帶」活計,就從那裡開始。