JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

遺傳密碼:讀取密碼子

細胞此刻手裡攥著一條已經完工的 RNA 訊息——可一套只有四個字母的「字母表」,怎麼拼得出一條用二十種字母寫成的蛋白質?我們來破譯遺傳密碼:字母是如何三個一組被讀取的、讀取從哪裡開始、又在哪裡停下,以及為什麼地球上幾乎所有生物都用著同一本密碼本。

四個字母的「字母表」,二十個字母的「語言」

在上一級的末尾,我們得到了一條已經完工、也編輯好的 信使 RNA——牠是某個基因的一條單鏈拷貝,用 A、C、G、U 這四個 RNA 字母寫成。如今這條訊息必須被變成一條蛋白質,而蛋白質是用一套完全不同的字母表寫就的:一條由 胺基酸串起來的鏈,胺基酸取自一個共二十種的集合。於是細胞面對的,是一個最名副其實的「翻譯」問題。牠必須把一段用四個字母寫成的文本,轉換成一段用二十個字母寫成的文本。怎麼轉?

把可能性數一數,答案幾乎自己就蹦出來了。如果細胞一次只讀一個字母,四個字母最多只能命名四種胺基酸——遠遠不夠。一次讀兩個字母能給出十六種組合(四乘以四),離二十還差一截。可一次讀三個字母,就能給出六十四種組合(四乘四乘四)——綽綽有餘。生命最終選定的正是這一種。訊息是以互不重疊、三個一組的方式被讀取的,每一個這樣的三聯體就叫做一個密碼子。一個 密碼子,就是遺傳密碼裡最基本的「單詞」。

閱讀框:從哪裡起讀,會改變一切

三聯體這個想法之所以微妙,關鍵就在這裡。mRNA 並不會在密碼子之間自帶空格。牠只是一長串字母,就像一句完全沒有間隔寫出來的話:一句話寫得字字相連沒有空格。所以你*從哪裡*開始把字母三個三個地分組——也就是閱讀框——會徹底改變這條訊息說的是什麼。哪怕只把起點挪動一個字母,下游的每一個密碼子都會被重新劃成另一個完全不同的單詞。

mRNA letters:  A U G C C U A C G G G A U A A

frame +0:     AUG CCU ACG GGA UAA   -> Met-Pro-Thr-Gly-STOP
frame +1:     A UGC CUA CGG GAU AA  -> (garbage, different words)
frame +2:     AU GCC UAC GGG AUA A  -> (garbage, different words)
同一串字母,存在三種可能的閱讀框。其中只有一種能拼出本來要表達的蛋白質;細胞必須鎖定那個正確的起點。

正因如此,接下來的兩個概念——一個固定的起始密碼子,以及幾個明確的終止密碼子——絕不是什麼可有可無的「收尾雜務」。牠們正是把閱讀框釘死在原位的東西。要是沒有一個約定好的起點,細胞就無從知道三種框裡哪一種才是真正的訊息,同一串字母也就能被讀成三種不同(而且大多毫無意義)的樣子。

起始、終止,以及一個基因的「標點」

讀取幾乎總是從一個特殊的密碼子開始:AUG。這就是起始密碼子,牠身兼兩職。牠一方面設定閱讀框——告訴核糖體「就從這裡開始三個三個地數」——另一方面牠本身也編碼一種胺基酸,即甲硫胺酸。所以幾乎每一條新合成的蛋白質都以一個甲硫胺酸開頭(之後細胞往往會把牠修掉)。正是這一個 AUG,化解了上一節裡整個閱讀框的難題,成了那個「定錨」。

讀取在三個密碼子中的任何一個處結束——UAA、UAG 和 UGA——牠們合稱終止密碼子。牠們與其餘所有密碼子都不一樣:牠們不命名任何胺基酸。根本就沒有任何一種 tRNA 能與牠們匹配。當讀取機器走到一個終止密碼子時,沒有胺基酸可以被送來,蛋白質鏈便被釋放,翻譯隨之停止。所以終止密碼子就像一句話末尾的句號——牠本身不攜帶任何「字母」,只是標出結尾。

請留意這是如何把六十四個密碼子分配出去的。其中一個(AUG)是起始,三個是終止,剩下的六十個全都用來命名胺基酸。六十個密碼子去分擔區區二十種胺基酸的活兒——這種「供大於求」的不對稱,正是下一個重要概念,也正是這套密碼如此穩健的原因所在。

簡併性與擺動:為什麼是六十一對二十

六十一個密碼子(六十四個減去三個終止密碼子)去對應二十種胺基酸,所以大多數胺基酸都由不止一個密碼子命名。比如胺基酸白胺酸有六個不同的密碼子;而甲硫胺酸和色胺酸則各只有一個。這種「一種胺基酸對應多個密碼子」的特性,叫做簡併性(又稱冗餘)。牠不是馬虎,而是一項特性。因為那些「多出來」的密碼子通常只在*第三個*字母上不同,所以最後這一位上的一個筆誤,往往拼出來仍是同一種胺基酸,於是蛋白質毫髮無損。這套密碼自帶一個針對微小複製錯誤的「減震器」。

在「如何讀取」這一點上,還藏著一個巧妙的機關。每一種胺基酸都由一種轉運 RNA 送來,牠那三個字母的反密碼子與密碼子配對。你或許會以為細胞會備齊六十一種不同的 tRNA,給每一個編碼密碼子各配一種——可牠並不這麼做。在密碼子第三位上的配對是鬆動的:單單一種 tRNA 就能識別好幾個僅在最後那個字母上有別的密碼子。法蘭西斯·克里克把這種「鬆動」稱為擺動假說。正因如此,細胞用遠少於密碼子數目的 tRNA 就能矇混過關,而這又與我們剛見過的簡併性嚴絲合縫地呼應——無論是在密碼本裡,還是在讀取牠的過程中,第三個字母都是那個最「寬容」的位置。

幾乎所有生命,都共用一本密碼本

現在要講的這部分,理應讓你真正停下來怔一怔。密碼子與胺基酸之間的對應關係——AUG 代表甲硫胺酸、UUU 代表苯丙胺酸,等等——在一個細菌、一棵紅杉、一株蘑菇和你身上,幾乎是一模一樣的。我們稱這套密碼近乎通用。這個「近乎」很要緊,待會兒我們會回頭說牠,但請先在這個核心事實上停留片刻:一本共用的密碼本,貫穿了幾乎整個生命世界。

為什麼這件事令人驚嘆?因為化學上並沒有任何東西*強迫* AUG 必須代表甲硫胺酸。密碼子與胺基酸的配對,更像是一種約定俗成,而不是一條物理定律——換成許許多多別的密碼本,本來也照樣行得通。所以,生命的每一個分支都在使用*同一套*這種任意的約定,這是「所有生命都源自同一個共同祖先」這一論斷最有力的單條線索。這套密碼在很久以前就被定死在一個共同的祖先細胞裡,隨後又被如此深地烙進了生命運轉的方式之中,以至於一旦改動牠,就會同時把每一條蛋白質都攪亂——這代價太大,永遠划不來去推翻。這正是當初我們頭一回比較細菌、古菌與真核生物時,你所接觸到的「共同祖先」這一觀念在分子層面上的迴響。

現在來誠實地說說那個「近乎」。這套密碼並不是完美通用的。少數幾種生物,以及更常見的、我們自己細胞裡的粒線體,都有幾個被重新指派過的密碼子——比如,一個在標準密碼裡意思是「終止」的密碼子,在人類粒線體裡卻被讀作一種胺基酸。這些例外既稀少又微小,而牠們恰恰正是我們對一套共享密碼所應有的預期:牠偶爾會在某個與世隔絕的角落裡發生漂變。牠們並不推翻通用性;反而印證了這套密碼是有一段歷史的。(而正是這種通用性,使基因工程成為可能:一個被放進細菌裡的人類基因能被正確讀取,就因為這隻細菌用的是同一本密碼本。)

把牠串起來

退後一步看,遺傳密碼不過是一張帶著幾條「語法規則」的查找表。如今我們已經把那些規則一一講清——三個一組地讀、在一個固定的框裡讀、從起始讀到終止、以簡併性作為安全網,還有一本近乎通用、為幾乎所有生命所共享的密碼本。這就把整個故事中關於*資訊*的那一半補全了:我們現在能確切地說出,一條 mRNA *意味著*什麼。我們還沒見到的,是那台真正動手去讀牠的機器。

那台機器就是核糖體,而牠一個密碼子接一個密碼子地讀取,正是中心法則的後半程——也就是真正意義上的翻譯。在下一篇裡,我們將看著核糖體鎖定一個起始密碼子、一次一個密碼子地拉入與之匹配的 tRNA,再把牠們攜帶的胺基酸縫合成一條不斷增長的鏈。本篇裡的一切都是那本規則手冊;接下來要做的,是把牠朗讀出來。