JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

遗传密码:每次三个字母

四个 RNA 字母如何拼出二十种氨基酸?靠叫做密码子的三联体。学会读这套密码、找到阅读框,并明白起始与终止密码子为何划定边界。

为什么是三个?

信息只用四个字母写成——A、U、G、C——但蛋白质由大约二十种不同的氨基酸构成。四个字母每次读一个,只能命名四种氨基酸;每次读两个,也只有十六种。你需要每个词至少三个字母,才能超过二十。事实正是如此,细胞以三联体的方式读取信息。每个三字母词是一个密码子,而从密码子到氨基酸的完整查找表,就是遗传密码

四个选项里取三个字母,得到 4 × 4 × 4 = 64 个可能的密码子——对二十种氨基酸来说绰绰有余。多出来的并未浪费:大多数氨基酸由不止一个密码子拼出,这种冗余让密码对小错误更具韧性。正因如此,我们说这套密码是简并的,但绝不含糊:每个密码子都只表示一种东西。

词从哪里开始:阅读框

密码子之间没有空格,所以你从哪里开始计数,决定了之后的每一个词。这个起点以及它确立的三联体分组,叫做阅读框。把起点挪一个字母,下游每一个密码子都会变——整句话就变成乱码。

所以细胞不会从随机的地方开始计数。它寻找一个特定信号——起始密码子,也就是三联体 AUG——并从那里开始阅读框。AUG 身兼三职:它说“从这里开始”,它确立阅读框,它还编码氨基酸甲硫氨酸,几乎每条新蛋白质的第一个氨基酸。

读到结尾

阅读逐个密码子继续,每读一个就加一个氨基酸,直到细胞撞上三个特殊三联体之一——UAA、UAG 或 UGA——它们根本不命名任何氨基酸。这些是终止密码子。它们是句号:当其中一个在阅读框中出现,蛋白质就完成并被释放。从起始密码子到终止密码子,阅读框精确地界定了哪一段信息会变成蛋白质。

READING A MESSAGE IN FRAME

  mRNA:  ...C  AUG  GCA  UUU  GGC  UAA  C...
              └─┬─┘ └─┬─┘ └─┬─┘ └─┬─┘ └─┬─┘
  codon:      AUG   GCA   UUU   GGC   UAA
  meaning:   START  Ala   Phe   Gly   STOP
             (Met)

  Protein built: Met - Ala - Phe - Gly   (then released at STOP)

  Now shift the frame by ONE letter to the right:
  ...CA  UGG  CAU  UUG  GCU  AAC...
        Trp   His   Leu   Ala   Asn   ← a completely different protein!

  Same letters, different starting point = different message.
在框内从 AUG 读到终止密码子;把起点挪一个碱基,一切都被重写。