用鏈終止抑制劑進行 DNA 定序
讓 DNA 自我複製,卻給每個鹼基摻進一個「停」——長度便拼出序列。
要讀出一條 DNA 上字母的順序,桑格的妙招是:讓它自我複製——卻悄悄摻進一些「停止」字母,於是複製品在每一個位置上堆疊起來,它們的長度便拼出序列。
核心想法
DNA 是一串由四個字母寫成的密碼——A、C、G、T。幾十年裡,我們看得見字母在那兒,卻讀不出它們的順序。弗雷德里克·桑格找到了辦法。你取來想讀的那條鏈,讓一台「複製酶」逐字搭出它的互補鏈。聰明之處在於你往混合液裡加了什麼:幾個被「做了手腳」的字母——「雙脫氧」版本——複製酶會樂意把它接上,可一旦接上,就再也不許任何字母加進來。每一個,都是一個句號。
把這件事做四遍,每種字母一遍,每遍只對 A、或只對 C……做手腳。在「遇 A 即停」的那一批裡,你得到的是在序列中每一個 A 處都停下的複製品;在「遇 C 即停」的那一批裡,得到的是在每一個 C 處停下的複製品。如今,分裝在四堆裡的,是一份「在每一個位置都停過」的複製品——而每一份複製品的長度,恰好告訴你它那個「停止字母」坐落在何處。
它是如何誕生的
到 1970 年代中期,DNA 的化學已經為人所知,但讀出一段長序列依舊慢得令人髮指。桑格在劍橋的醫學研究理事會分子生物學實驗室裡默默工作,他早已因測出蛋白質——胰島素——的序列而獲過一次諾貝爾獎。他把同樣的耐心轉向了 DNA。他先與艾倫·庫爾森做出一個較為笨拙的「加減」法;隨後,1977 年,那個優雅的方法來了——雙脫氧法,又叫鏈終止法。也正是這一年,一對美國人,阿蘭·馬克薩姆與沃爾特·吉爾伯特,發表了一種全然不同的化學方法。有一陣子兩者都在用,但桑格的那個更省事,也正是機器最終能學會去跑的那一個。1980 年,它為他帶來第二座諾貝爾獎。
它為何重要
在此之前,基因組是一本闔著的書。桑格的方法把它翻開了。一旦能讀出字母的順序,你就能找出某種疾病背後的基因,把一個物種的 DNA 與另一個物種相比較,並核對一次編輯是否如你所願。把它提速、交給機器,正是這同一個想法讀出了整部人類基因組——三十億個字母——奠定了現代遺傳學與醫學的根基。
一個可以想像的畫面
想像你在複印一句很長的話,但你的複印機被動了手腳:它會隨機地、在複印完某個特定字母——比方說每遇到一個「的」——之後卡住。印上一大疊,你就會得到停在第一個「的」、第二個「的」、第三個「的」……的一張張紙。把它們從短到長排好,每一張停下的位置,恰好告訴你那個字在整句話裡落在哪兒。對每一個字都這麼做一遍,你單憑這些卡住的複印件的長度,就能把整句話重建出來。那些「停止」字母,就是雙脫氧鹼基;而長度,是從一塊凝膠上讀出來的。
它的位置
沃森與克里克(1953)表明 DNA 是一種配對在雙螺旋裡的四字母密碼;桑格的複製酶所利用的,正是這種配對。孟德爾那些抽象的「因子」,到此已成為可以讀出的一段段字母。桑格定序隨後與 PCR(1985)聯手——後者把一個基因複製到足夠讀出的數量——一路通向人類基因組計劃,通向今天能編輯基因的醫學:在那裡,一次 CRISPR 編輯,正是靠測出它所改動的那些字母來核對的。
A new method for determining nucleotide sequences in DNA is described.
It is similar to the "plus and minus" method but makes use of the 2′,3′-dideoxy and arabinonucleoside analogues of the normal deoxynucleoside triphosphates, which act as specific chain-terminating inhibitors of DNA polymerase.
The technique has been applied to the DNA of bacteriophage ϕX174 and is more rapid and more accurate than either the plus or the minus method.