遺傳密碼：讀取密碼子

四個字母的「字母表」，二十個字母的「語言」

在上一級的末尾，我們得到了一條已經完工、也編輯好的信使 RNA——牠是某個基因的一條單鏈拷貝，用 A、C、G、U 這四個 RNA 字母寫成。如今這條訊息必須被變成一條蛋白質，而蛋白質是用一套完全不同的字母表寫就的：一條由胺基酸串起來的鏈，胺基酸取自一個共二十種的集合。於是細胞面對的，是一個最名副其實的「翻譯」問題。牠必須把一段用四個字母寫成的文本，轉換成一段用二十個字母寫成的文本。怎麼轉？

把可能性數一數，答案幾乎自己就蹦出來了。如果細胞一次只讀一個字母，四個字母最多只能命名四種胺基酸——遠遠不夠。一次讀兩個字母能給出十六種組合（四乘以四），離二十還差一截。可一次讀三個字母，就能給出六十四種組合（四乘四乘四）——綽綽有餘。生命最終選定的正是這一種。訊息是以互不重疊、三個一組的方式被讀取的，每一個這樣的三聯體就叫做一個密碼子。一個密碼子，就是遺傳密碼裡最基本的「單詞」。

閱讀框：從哪裡起讀，會改變一切

三聯體這個想法之所以微妙，關鍵就在這裡。mRNA 並不會在密碼子之間自帶空格。牠只是一長串字母，就像一句完全沒有間隔寫出來的話：一句話寫得字字相連沒有空格。所以你*從哪裡*開始把字母三個三個地分組——也就是閱讀框——會徹底改變這條訊息說的是什麼。哪怕只把起點挪動一個字母，下游的每一個密碼子都會被重新劃成另一個完全不同的單詞。

mRNA letters:  A U G C C U A C G G G A U A A

frame +0:     AUG CCU ACG GGA UAA   -> Met-Pro-Thr-Gly-STOP
frame +1:     A UGC CUA CGG GAU AA  -> (garbage, different words)
frame +2:     AU GCC UAC GGG AUA A  -> (garbage, different words)

同一串字母，存在三種可能的閱讀框。其中只有一種能拼出本來要表達的蛋白質；細胞必須鎖定那個正確的起點。

正因如此，接下來的兩個概念——一個固定的起始密碼子，以及幾個明確的終止密碼子——絕不是什麼可有可無的「收尾雜務」。牠們正是把閱讀框釘死在原位的東西。要是沒有一個約定好的起點，細胞就無從知道三種框裡哪一種才是真正的訊息，同一串字母也就能被讀成三種不同（而且大多毫無意義）的樣子。

起始、終止，以及一個基因的「標點」

讀取幾乎總是從一個特殊的密碼子開始：AUG。這就是起始密碼子，牠身兼兩職。牠一方面設定閱讀框——告訴核糖體「就從這裡開始三個三個地數」——另一方面牠本身也編碼一種胺基酸，即甲硫胺酸。所以幾乎每一條新合成的蛋白質都以一個甲硫胺酸開頭（之後細胞往往會把牠修掉）。正是這一個 AUG，化解了上一節裡整個閱讀框的難題，成了那個「定錨」。

讀取在三個密碼子中的任何一個處結束——UAA、UAG 和 UGA——牠們合稱終止密碼子。牠們與其餘所有密碼子都不一樣：牠們不命名任何胺基酸。根本就沒有任何一種 tRNA 能與牠們匹配。當讀取機器走到一個終止密碼子時，沒有胺基酸可以被送來，蛋白質鏈便被釋放，翻譯隨之停止。所以終止密碼子就像一句話末尾的句號——牠本身不攜帶任何「字母」，只是標出結尾。

請留意這是如何把六十四個密碼子分配出去的。其中一個（AUG）是起始，三個是終止，剩下的六十個全都用來命名胺基酸。六十個密碼子去分擔區區二十種胺基酸的活兒——這種「供大於求」的不對稱，正是下一個重要概念，也正是這套密碼如此穩健的原因所在。

簡併性與擺動：為什麼是六十一對二十

六十一個密碼子（六十四個減去三個終止密碼子）去對應二十種胺基酸，所以大多數胺基酸都由不止一個密碼子命名。比如胺基酸白胺酸有六個不同的密碼子；而甲硫胺酸和色胺酸則各只有一個。這種「一種胺基酸對應多個密碼子」的特性，叫做簡併性（又稱冗餘）。牠不是馬虎，而是一項特性。因為那些「多出來」的密碼子通常只在*第三個*字母上不同，所以最後這一位上的一個筆誤，往往拼出來仍是同一種胺基酸，於是蛋白質毫髮無損。這套密碼自帶一個針對微小複製錯誤的「減震器」。

在「如何讀取」這一點上，還藏著一個巧妙的機關。每一種胺基酸都由一種轉運 RNA 送來，牠那三個字母的反密碼子與密碼子配對。你或許會以為細胞會備齊六十一種不同的 tRNA，給每一個編碼密碼子各配一種——可牠並不這麼做。在密碼子第三位上的配對是鬆動的：單單一種 tRNA 就能識別好幾個僅在最後那個字母上有別的密碼子。法蘭西斯·克里克把這種「鬆動」稱為擺動假說。正因如此，細胞用遠少於密碼子數目的 tRNA 就能矇混過關，而這又與我們剛見過的簡併性嚴絲合縫地呼應——無論是在密碼本裡，還是在讀取牠的過程中，第三個字母都是那個最「寬容」的位置。

幾乎所有生命，都共用一本密碼本

現在要講的這部分，理應讓你真正停下來怔一怔。密碼子與胺基酸之間的對應關係——AUG 代表甲硫胺酸、UUU 代表苯丙胺酸，等等——在一個細菌、一棵紅杉、一株蘑菇和你身上，幾乎是一模一樣的。我們稱這套密碼近乎通用。這個「近乎」很要緊，待會兒我們會回頭說牠，但請先在這個核心事實上停留片刻：一本共用的密碼本，貫穿了幾乎整個生命世界。

為什麼這件事令人驚嘆？因為化學上並沒有任何東西*強迫* AUG 必須代表甲硫胺酸。密碼子與胺基酸的配對，更像是一種約定俗成，而不是一條物理定律——換成許許多多別的密碼本，本來也照樣行得通。所以，生命的每一個分支都在使用*同一套*這種任意的約定，這是「所有生命都源自同一個共同祖先」這一論斷最有力的單條線索。這套密碼在很久以前就被定死在一個共同的祖先細胞裡，隨後又被如此深地烙進了生命運轉的方式之中，以至於一旦改動牠，就會同時把每一條蛋白質都攪亂——這代價太大，永遠划不來去推翻。這正是當初我們頭一回比較細菌、古菌與真核生物時，你所接觸到的「共同祖先」這一觀念在分子層面上的迴響。

現在來誠實地說說那個「近乎」。這套密碼並不是完美通用的。少數幾種生物，以及更常見的、我們自己細胞裡的粒線體，都有幾個被重新指派過的密碼子——比如，一個在標準密碼裡意思是「終止」的密碼子，在人類粒線體裡卻被讀作一種胺基酸。這些例外既稀少又微小，而牠們恰恰正是我們對一套共享密碼所應有的預期：牠偶爾會在某個與世隔絕的角落裡發生漂變。牠們並不推翻通用性；反而印證了這套密碼是有一段歷史的。（而正是這種通用性，使基因工程成為可能：一個被放進細菌裡的人類基因能被正確讀取，就因為這隻細菌用的是同一本密碼本。）

把牠串起來

退後一步看，遺傳密碼不過是一張帶著幾條「語法規則」的查找表。如今我們已經把那些規則一一講清——三個一組地讀、在一個固定的框裡讀、從起始讀到終止、以簡併性作為安全網，還有一本近乎通用、為幾乎所有生命所共享的密碼本。這就把整個故事中關於*資訊*的那一半補全了：我們現在能確切地說出，一條 mRNA *意味著*什麼。我們還沒見到的，是那台真正動手去讀牠的機器。

那台機器就是核糖體，而牠一個密碼子接一個密碼子地讀取，正是中心法則的後半程——也就是真正意義上的翻譯。在下一篇裡，我們將看著核糖體鎖定一個起始密碼子、一次一個密碼子地拉入與之匹配的 tRNA，再把牠們攜帶的胺基酸縫合成一條不斷增長的鏈。本篇裡的一切都是那本規則手冊；接下來要做的，是把牠朗讀出來。