為什麼是三個?
訊息只用四個字母寫成——A、U、G、C——但蛋白質由大約二十種不同的胺基酸構成。四個字母每次讀一個,只能命名四種胺基酸;每次讀兩個,也只有十六種。你需要每個詞至少三個字母,才能超過二十。事實正是如此,細胞以三聯體的方式讀取訊息。每個三字母詞是一個密碼子,而從密碼子到胺基酸的完整查找表,就是遺傳密碼。
四個選項裡取三個字母,得到 4 × 4 × 4 = 64 個可能的密碼子——對二十種胺基酸來說綽綽有餘。多出來的並未浪費:大多數胺基酸由不止一個密碼子拼出,這種冗餘讓密碼對小錯誤更具韌性。正因如此,我們說這套密碼是簡併的,但絕不含糊:每個密碼子都只表示一種東西。
詞從哪裡開始:閱讀框
密碼子之間沒有空格,所以你從哪裡開始計數,決定了之後的每一個詞。這個起點以及它確立的三聯體分組,叫做閱讀框。把起點挪一個字母,下游每一個密碼子都會變——整句話就變成亂碼。
所以細胞不會從隨機的地方開始計數。它尋找一個特定訊號——起始密碼子,也就是三聯體 AUG——並從那裡開始閱讀框。AUG 身兼三職:它說「從這裡開始」,它確立閱讀框,它還編碼胺基酸甲硫胺酸,幾乎每條新蛋白質的第一個胺基酸。
讀到結尾
閱讀逐個密碼子繼續,每讀一個就加一個胺基酸,直到細胞撞上三個特殊三聯體之一——UAA、UAG 或 UGA——它們根本不命名任何胺基酸。這些是終止密碼子。它們是句號:當其中一個在閱讀框中出現,蛋白質就完成並被釋放。從起始密碼子到終止密碼子,閱讀框精確地界定了哪一段訊息會變成蛋白質。
READING A MESSAGE IN FRAME
mRNA: ...C AUG GCA UUU GGC UAA C...
└─┬─┘ └─┬─┘ └─┬─┘ └─┬─┘ └─┬─┘
codon: AUG GCA UUU GGC UAA
meaning: START Ala Phe Gly STOP
(Met)
Protein built: Met - Ala - Phe - Gly (then released at STOP)
Now shift the frame by ONE letter to the right:
...CA UGG CAU UUG GCU AAC...
Trp His Leu Ala Asn ← a completely different protein!
Same letters, different starting point = different message.