遺傳密碼：每次三個字母

為什麼是三個？

訊息只用四個字母寫成——A、U、G、C——但蛋白質由大約二十種不同的胺基酸構成。四個字母每次讀一個，只能命名四種胺基酸；每次讀兩個，也只有十六種。你需要每個詞至少三個字母，才能超過二十。事實正是如此，細胞以三聯體的方式讀取訊息。每個三字母詞是一個密碼子，而從密碼子到胺基酸的完整查找表，就是遺傳密碼。

四個選項裡取三個字母，得到 4 × 4 × 4 = 64 個可能的密碼子——對二十種胺基酸來說綽綽有餘。多出來的並未浪費：大多數胺基酸由不止一個密碼子拼出，這種冗餘讓密碼對小錯誤更具韌性。正因如此，我們說這套密碼是簡併的，但絕不含糊：每個密碼子都只表示一種東西。

詞從哪裡開始：閱讀框

密碼子之間沒有空格，所以你從哪裡開始計數，決定了之後的每一個詞。這個起點以及它確立的三聯體分組，叫做閱讀框。把起點挪一個字母，下游每一個密碼子都會變——整句話就變成亂碼。

所以細胞不會從隨機的地方開始計數。它尋找一個特定訊號——起始密碼子，也就是三聯體 AUG——並從那裡開始閱讀框。AUG 身兼三職：它說「從這裡開始」，它確立閱讀框，它還編碼胺基酸甲硫胺酸，幾乎每條新蛋白質的第一個胺基酸。

讀到結尾

閱讀逐個密碼子繼續，每讀一個就加一個胺基酸，直到細胞撞上三個特殊三聯體之一——UAA、UAG 或 UGA——它們根本不命名任何胺基酸。這些是終止密碼子。它們是句號：當其中一個在閱讀框中出現，蛋白質就完成並被釋放。從起始密碼子到終止密碼子，閱讀框精確地界定了哪一段訊息會變成蛋白質。

READING A MESSAGE IN FRAME

  mRNA:  ...C  AUG  GCA  UUU  GGC  UAA  C...
              └─┬─┘ └─┬─┘ └─┬─┘ └─┬─┘ └─┬─┘
  codon:      AUG   GCA   UUU   GGC   UAA
  meaning:   START  Ala   Phe   Gly   STOP
             (Met)

  Protein built: Met - Ala - Phe - Gly   (then released at STOP)

  Now shift the frame by ONE letter to the right:
  ...CA  UGG  CAU  UUG  GCU  AAC...
        Trp   His   Leu   Ala   Asn   ← a completely different protein!

  Same letters, different starting point = different message.

在框內從 AUG 讀到終止密碼子；把起點挪一個鹼基，一切都被重寫。