轉錄：寫出一份 RNA 副本

為什麼非要抄一份？工作便條的意義

上一篇留給我們一組張力：基因組裝著一切，可一本擱在書架上的書做不出飯來。細胞的答案，就是中心法則的第一步，從 DNA 到 RNA：與其把那份主檔案拖到車間去，細胞只把此刻真正需要的那一個基因抄出一份短小、用完即棄的副本。這個抄錄過程就是轉錄，而這個動作恰如其字面所言——你抄錄一段文字，是把它在新的載體上重新寫一遍，而不是把那一頁從原書裡撕下來。

有兩點讓這一招顯得高明，而非浪費。其一，原始 DNA 始終不離開細胞核（或細胞內部）的安全地帶——檔案保持原封不動，讓用完即棄的副本到機器所在之處去幹粗活。其二，細胞可以為一個忙碌的基因抄出*許多*份副本，而對一個難得用到的基因只抄一份，於是這個抄錄步驟本身就成了控制每種產物造多少的「音量旋鈕」。一份 DNA 藍圖能甩出成千上萬張一模一樣的便條，而每張便條在任務完成後都可以扔掉。

機器與它的起點：RNA 聚合酶遇上啟動子

做這件「寫」的活兒的機器，是 RNA 聚合酶——一種蛋白質複合體，它的全部職責就是沿著 DNA 爬行，把一份 RNA 副本一個字母一個字母地串起來。（它是你在複製那一級裡認識的 DNA 聚合酶的表親；兩者都讀取一條 DNA 模板、造出一條新鏈，只不過這一位寫的是 RNA。）它面對的深層難題，是*找到起點*。你的 DNA 長達數十億個字母，某個基因就埋在其中的某處。這台機器要怎樣從浩如煙海的文本裡，知道某個基因從哪裡起頭——又該抄成千上萬個基因中的哪一個？

答案，是寫在每個基因上游 DNA 裡的一個地標：啟動子。啟動子並不屬於那條訊息本身；它是一段短短的特徵序列，意思是「基因從這裡開始，朝這個方向讀」。把它想成一道菜譜頂端的標題和起跑箭頭。RNA 聚合酶（常常由一些輔助蛋白引導著）識別出某個啟動子、停靠上去，而這一結合既把機器*定位*在正確的位置，又給它*指明*了正確的方向。沒有啟動子，就沒有轉錄——這也正是為什麼，當細胞要決定開啟哪些基因時，啟動子會成為一個總開關。

抄哪一條鏈——以及那個會移動的氣泡

這裡有一個幾乎絆倒所有人的點，所以我們慢慢來。DNA 有兩條鏈，彼此反向平行，靠鹼基配對結合在一起。RNA 聚合酶*只把其中一條*當作樣板來讀——那就是模板鏈（也叫反義鏈）。它讀這條模板，鋪下與之配對的 RNA 字母。而*另一條*、被它忽略的鏈，是編碼鏈（或稱有義鏈）——妙就妙在這裡：正因為鹼基配對，那份 RNA 副本最終讀起來幾乎和這條編碼鏈一模一樣，只是把 T 換成了 U。所以，機器從不碰的那條鏈，恰恰是訊息在序列上與之相像的那條。

  coding strand (sense)    5'- A T G  C G  A  T  T  C -3'   <- RNA reads like this (U for T)
                               | | |  | |  |  |  |  |
  template strand (antisense) 3'- T A C  G C  T  A  A  G -5'   <- the machine actually reads THIS
                                  |
                                  v   RNA polymerase pairs A->U, C->G, G->C, T->A
  RNA transcript           5'- A U G  C G  A  U  U  C ...     (matches coding strand, T -> U)

機器讀的是模板鏈，但產出的 RNA 卻與編碼鏈相符（其中 U 取代了 T）。「編碼鏈」與「模板鏈」的身份是逐個基因決定的，而非整條鏈固定不變：螺旋上更遠處的另一個基因，可能反過來用對面那條鏈當模板。

要讀取一條模板，機器必須先把兩條鏈撬開——DNA 的字母是藏在雙螺旋*內側*的，配著對時根本讀不到。於是 RNA 聚合酶在局部拉開約十幾個鹼基對，打開一個小小的轉錄氣泡：一小段兩條 DNA 鏈彼此分開、模板暴露在外的區域。美妙之處在於，這個氣泡會跟著機器移動。聚合酶一邊往前走，一邊在它前緣解開新的 DNA，又讓身後的兩條鏈重新合攏，所以任何時刻都只開著一扇很小的窗。螺旋只被打開到剛好夠用、且恰在需要之處，隨即又被重新拉合——檔案絕不會被危險地長時間散開。

起始、延伸、終止

和大多數分子過程一樣，轉錄分三幕展開：它必須開始、進行、停止。這些可不是官僚式的標籤——每一幕都在解決一個真實的難題。開始，是要*找對地方並下定決心*；進行，是要*又快又準地抄錄*；停止，是要*知道基因在哪裡結束並鬆手放開*。把這三幕走一遍，整個過程就會一下子拼合到一起。

起始。RNA 聚合酶攜同它的輔助蛋白，識別並鉗住啟動子，隨即打開轉錄氣泡的第一段。它不需要引子——與 DNA 聚合酶不同，它能從零開始一條 RNA 鏈。一旦鋪下頭幾個 RNA 字母，它便下定決心、掙脫啟動子，把那個起始訊號留在身後。
延伸。機器此刻沿著模板平穩滑行，氣泡隨之移動。每走一步，它就讀出模板上的下一個鹼基，添上與之相配的 RNA 字母（A 配 U、G 配 C，依此類推），讓鏈朝一個方向生長，速度大約是每秒幾十個字母。新造出的 RNA 在身後剝離開來，與此同時 DNA 重新合攏。
終止。當機器抵達 DNA 裡寫好的一個停止訊號時，它便釋放出造好的 RNA、從模板上脫落下來，氣泡也徹底合上。DNA 被原樣留下——毫髮無損，隨時可以再被抄錄一次——而一條嶄新的 RNA 鏈則自由地飄走了。

最後飄走的那條鏈，就是初級轉錄本——直接從基因上抄下來的、未經加工的初稿 RNA。這三幕的合稱，起始、延伸與終止，值得記牢，因為當你走到下一級的翻譯時，*同樣這一組三幕*還會再度登場。不過，有一處簡化要誠實交代：在真核生物裡，這是一樁需要許多輔助蛋白參與、受到引導和調控的事，而產出的初稿幾乎總是還要經過編輯才算就緒——這正是下一篇要講的內容。

為什麼是 RNA，而不是更多 DNA？工作副本天生不同

把 DNA 抄成更多 DNA，看上去會更省事。可細胞偏偏要抄成 RNA，而這兩者之間的差異，恰恰正是讓 RNA 成為一份好的*用完即棄的工作副本*、而非第二份檔案的原因。有三處差異要緊。RNA 在 DNA 用胸腺嘧啶（T）的地方改用鹼基尿嘧啶（U）——化學上幾乎相同，卻是一個把 RNA 標記為 RNA 的記號。RNA 的糖是核糖，比 DNA 的脫氧核糖多帶一個氧；這個多出來的氧讓 RNA 在化學上更活潑，因而也更不穩定。還有，RNA 通常是單鏈的，而 DNA 是那條著名的雙螺旋。

請把這些特性讀成優點，而非缺陷。DNA 是為了*持久*而生的——用兩條鏈，好讓信息有備份、受保護；用穩定的糖，好讓它伴隨一生而不壞。RNA 則是為了*用完即棄*而生的——單鏈，所以它靈活輕便，能被自由地讀取和摺疊；不那麼穩定，所以一旦訊息送達，它便不會賴著不走、堆在細胞裡礙事。一份短命、易降解的副本，正是按需工作便條所需要的：造出來、用一用、讓它分解掉。這份脆弱，本身就是關鍵所在。

把它串起來：一份初稿，而非定稿

退後一步，把整場戲重放一遍。RNA 聚合酶找到一個啟動子並鎖定上去（起始）；它撬開一個會移動的轉錄氣泡、讀取模板鏈，鋪下與編碼鏈相符、只是以 U 代 T 的 RNA 字母（延伸）；它撞上一個停止訊號，釋放出自己的產物，讓身後的 DNA 重新合攏（終止）。飄走的，是一條單鏈的 RNA 初級轉錄本——某個基因一份嶄新、用完即棄的副本，而原件在整個過程中毫髮無損。

但請留意*初級*、或者說*初稿*這個詞。在真核生物裡，聚合酶產出的，還不是一條乾淨、可直接使用的訊息。它仍帶著一些必須被剪掉的片段，而且在它能安全地離開細胞核、被讀取之前，還需要加上保護性的帽子和尾巴。把它稱作基因組的初稿，在兩個方向上都是誠實的：它是這個基因一份貨真價實的副本，同時它又尚未完成。把這條未經加工的轉錄本，編輯成一條成熟、可用的信使 RNA的過程，是下一篇的主題——RNA 加工那套出人意料的「剪刀加膠帶」活計，就從那裡開始。