一張圖,托住整個領域
在上一篇指南裡,你已經認識了分子生物學的主角:DNA、RNA 和蛋白質,以及讓它們彼此結合的化學原理。現在,我們讓它們動起來。這個領域裡最有用的一個觀念——你會一次又一次用到它——就是[[molbio-central-dogma|中心法則]]:它講的是*資訊*在這些分子之間朝哪個方向流動。它不是一條物理定律,而是對細胞實際所作所為的一段極其精煉的概括;學會讀懂它,就像在出發徒步前先拿到了地圖。
下面就是那個著名的核心,用純文字寫出來:DNA -> RNA -> 蛋白質。DNA 複製自己(複製),DNA 被讀取成 RNA(轉錄),RNA 又被讀取成蛋白質(轉譯)。這就是活細胞內部資訊流動的日常往來。三種分子,三個箭頭。這架階梯上幾乎其餘的一切,都不過是在詳細回答:其中某個箭頭*如何*運作、細胞*何時*決定沿著它發出資訊,以及當機器出錯時*會發生什麼*。
replication
(loop)
|
DNA --transcription--> RNA --translation--> PROTEIN
^
|__ reverse transcription (from RNA, by special enzymes)每個箭頭到底在做什麼
我們一個箭頭一個箭頭地看,因為每一個都是由分子機器完成的、實實在在的物理複製工作。複製是 DNA 在細胞分裂前造出第二份 DNA 的方式。回想上一篇裡反平行的雙螺旋——兩條鏈朝相反方向延伸,A 總是伸過去與 T 配對,G 與 C 配對。細胞把兩條鏈拉開,分別以每條為模板造出一條新的搭檔鏈,於是每個子細胞都繼承一條舊鏈和一條新鏈。這種一半舊、一半新的優雅模式叫做半保留複製,它也正解釋了為什麼鹼基配對規則如此重要:一條鏈上的序列決定了另一條鏈的序列。
[[transcription-overview|轉錄]]把一段 DNA——一個基因——抄寫成一份簡短的、單鏈的 RNA 工作副本。可以把 DNA 想成鎖在圖書館裡的母本檔案,把 RNA 想成你能帶到工作檯上的一次性影印件。它遵循同樣的鹼基配對邏輯(只是 RNA 用 U 代替 T),由一種叫做 RNA 聚合酶的酶來完成抄寫。由於細胞只在需要某個基因的產物時才新造一份 RNA 副本,轉錄便成了細胞*決定*開啟什麼的主要場所——這個控制節點,在之後幾乎每一級階梯上我們都會重訪。
[[molbio-translation-initiation|轉譯]]讀取 RNA 資訊並造出蛋白質。著名的遺傳密碼就在這裡登場:RNA 每次讀三個字母,每個三字母的密碼子指定要往不斷生長的蛋白質鏈上添加的一個胺基酸。比如讀到 5'-AUG GCU UUU-3',意思就是:起始,然後丙胺酸,再然後苯丙胺酸。在物理上把密碼與胺基酸對應起來的分子,是一種小小的轉接器——轉運 RNA(tRNA),整個組裝過程在核糖體上進行。所以這些箭頭不是比喻——它們是三台不同的複製機器,每一台都執行著一套清晰的配對規則。
克里克的真正主張(以及那個著名的誤讀)
這是整篇指南裡最重要的一處坦誠。法蘭西斯·克里克在 1958 年提出了中心法則,而人們從那以後就一直在誤引它。流行的說法——「資訊只能從 DNA -> RNA -> 蛋白質流動,*絕不可能*倒著走」——並不是克里克的本意。他選用「法則(dogma)」這個戲劇性的詞,部分是出於一種俏皮的玩笑,而且他對這條主張究竟涵蓋什麼是很謹慎的。
克里克*真正*主張的,要狹窄、也要精確得多:資訊一旦*進入*蛋白質,就再也無法從蛋白質裡*出來*、回到核酸中去。在他的表述裡,序列資訊可以在核酸之間自由流動,也可以從核酸流向蛋白質,但大自然唯一禁止的方向,是蛋白質 -> 核酸。蛋白質的胺基酸順序,永遠不能被當作模板來書寫一段新的 RNA 或 DNA 序列。這——而且僅僅是這一條——才是中心法則真正劃下的那條線。
除了咬文嚼字之外,這個區分為什麼如此要緊?因為逆轉錄並不是一條罕見的腳註——它正是逆轉錄病毒把自己拷貝進我們基因組的方式,是一項關鍵實驗技術(RT-PCR,許多診斷檢測背後的引擎)讀取 RNA 的方式,也是我們自身基因組在演化中積累某些片段的方式。若把「倒流=不可能」當成法則,就會讓你對整整一層生物學視而不見。而誠實的版本既守住了這一層,又依然抓住了那個深刻的真理:蛋白質是資訊流的終點,永遠不是源頭。
跟著一條訊息,從基因走到蛋白質
讓我們跟著一條訊息,像一個忙碌的細胞那樣,走完這些日常箭頭。這整段旅程就叫做基因表現——把基因裡那份安靜的資訊,變成一個能幹活的分子。請記住那個影印件的比喻:任何東西都絕不會被寫回母本檔案上去。
- 細胞需要某種特定的蛋白質,於是它在 DNA 上找到對應的那個基因——序列中一段界定明確的區段——並在那裡把雙螺旋打開。
- RNA 聚合酶讀取其中一條 DNA 鏈,轉錄出與該基因相匹配的一份 RNA 副本;這份信使 RNA 用同樣的 A/U/G/C 語言寫成,把這道指令帶到造蛋白質的地方去。
- 核糖體夾住這條 RNA,從起始密碼子 AUG 開始,以三字母為單位的密碼子逐個讀取它。
- 對每一個密碼子,一個相匹配的 tRNA 送來正確的胺基酸,核糖體把胺基酸一個個連成一條鏈——這就是蛋白質,忠實地照著基因的字母造出來。
- 造好的鏈摺疊成一個能工作的形狀,去完成它的任務——到這裡就是終點:它的序列絕不會被抄回到 RNA 或 DNA 裡去。
在你把「一個基因 -> 一種蛋白質」記進腦子之前,有一處需要誠實說明:這句整齊的口號已經過時了。在我們的細胞裡,單個基因的 RNA 副本可以被以不同方式剪開再重新拼接——這就是替代剪接——於是一個基因可以產出好幾種不同的蛋白質。中心法則的那些箭頭依然完全成立;法則講的是資訊的*方向*,而不是一對一的數目。我們會在往上幾級的階梯上,把剪接好好講清楚。
為何這一張圖為之上的一切定下框架
一旦這些箭頭住進了你的腦子,階梯上其餘的部分就會自動圍繞它們組織起來。後面的每一級,本質上都是舉著一面放大鏡,照向這張圖的某一處:複製那一級,放大 DNA -> DNA 那個迴環及其驚人的精確度;轉錄與 RNA 那幾級,放大 DNA -> RNA,以及細胞隨後對訊息所做的一切;轉譯與蛋白質摺疊那幾級,放大 RNA -> 蛋白質,以及造好的鏈最終會變成什麼。而基因調控所問的,是*哪些*箭頭被觸發、*何時*被觸發。你不是在背一堆互不相干的事實——你是在往同一張共享的地圖上填空。
這張圖還告訴你:哪裡可能出錯,以及生物學在哪裡變得有趣。DNA 裡的一個筆誤——一處突變——可能改變一個密碼子,從而改變一個胺基酸;這類改變大多無害或沉默,少數有益,少數則致病。有些 RNA 根本不會變成蛋白質,卻以 RNA 的身份做著實實在在的工作,這暗示著一個遠古的 RNA 世界——在那時,也許在 DNA 與蛋白質出現之前,是 RNA 在主持大局。還有,極少數情況下,一個蛋白質的*形狀*能讓同種蛋白質的其他拷貝也變壞——這就是朊病毒(prion)——它看起來像是蛋白質在傳遞資訊,可它依然從不去改寫基因,所以法則真正的邊界依舊成立。