JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

我們如何讀出 DNA:桑格法與人類基因體計畫

第一種可靠讀出 DNA 字母的方法——桑格定序法——以及它所驅動的那場長達 13 年的跨國馬拉松:產出人類基因體首份草圖的人類基因體計畫。

桑格定序:靠故意「停下」來讀取

DNA 定序的意思是確定一條鏈上核苷酸——A、C、G、T——的確切排列順序。第一種能可靠做到這一點的方法由弗雷德里克·桑格於 1970 年代發明,至今仍在使用。其巧妙之處在於:用DNA 聚合酶複製 DNA,但偶爾摻入一種特殊的「鏈終止」字母,使複製停下來。重複幾十億次,你就會得到一批在每一個可能位置都有停止的拷貝。

  1. 先準備好許多份你想讀取的 DNA 拷貝,再加上一段短引子,給聚合酶一個起始的落腳點。
  2. 讓聚合酶用正常字母合成新鏈,其中混入少量終止字母,一旦摻入就會讓鏈停止延伸。
  3. 每個終止字母都帶有對應 A、C、G 或 T 的顏色標記,於是每個片段都被它的最後一個字母所標記。
  4. 凝膠電泳按長度把所有片段排序;從最短到最長依次讀出顏色,就拼出了整條序列。
Template strand:   3'- T A C G G A T C ...
New strands stop at each position:
  A                 (length 1)
  A T               (length 2)
  A T G             (length 3)
  A T G C           (length 4)
  ...
Sort by length, read the last letter of each:
  A, T, G, C, C, T, A, G ...  ->  the sequence
桑格的妙招:一架在每個位置都有停頓的片段「階梯」,一級一級地把序列拼出來。

人類基因體計畫:長達 13 年的馬拉松

桑格定序一次只能讀出幾百個字母。為了讀出 32 億個字母,人類基因體計畫(1990–2003 年)協調了六個國家的數千名科學家,把基因體拆成可處理的片段,逐一定序,再依據重疊處把它們重新拼接起來。這項公共計畫與 Celera 公司主導的私營競賽並行展開,最終產出了首份基本完整的人類基因體序列

這項計畫最深遠的遺產,並不是某一個人的 DNA,而是一份人人都可以在其上繼續構建的共享地圖。它的資料一經產生便免費公開,這一政策塑造了基因體學至今的運作方式。它拼接而成的那份合成序列,成了參考基因體的第一個版本——也就是第四篇指南的主題。