文本裡的一處改變,僅此而已
你來到這一級階梯時,已經從上一級帶來了兩件關鍵的事。你看到 DNA 的複製帶有校對,卻從不完美——偶爾會有一個錯誤的鹼基存活下來——你也看到,這並非災難,而是變異的安靜源頭。現在我們要給這種改變一個正式的名字。突變,說到最樸素處,就是 DNA 序列裡任何一處永久的改變——當一條鏈被複製時所傳下去的那串字母裡出現的差異。這就是它的全部定義:突變在於*文本本身*,而不在於對細胞造成的某種含糊的「傷害」。
把基因組想像成一本用四個字母——A、T、G、C——寫成的極長的書,書中連續的正文,通過遺傳密碼,拼寫出一個細胞能造出的各種蛋白質。突變就是對這本書的一次編輯。你可以把一個字母換成另一個。你可以塞進一個多餘的字母,或者刪掉一個。你可以把整整一段抄兩遍,或者刪去一章。每一種編輯,對這本書*說了什麼*都有不同的影響,而本篇餘下的內容,其實就是帶你逐一參觀那些最基本的編輯,看看它們對訊息做了什麼。請記住這個畫面:我們是在校讀一段文本,並追問某個錯字究竟把意思改變了多少。
換掉一個字母:點突變
可能存在的最小編輯,就是把單個鹼基換成另一個——這就是點突變,一處單字母的錯字。由於兩條鏈遵守嚴格的鹼基配對,在一條鏈上換掉一個鹼基,會在 DNA 下一次被複製時,逼著另一條鏈做出相應的對換:比方說,一對 A-T 就變成了一對 G-C。一處點突變恰好只改變階梯上的一根橫檔,而把整段序列的其餘部分原封不動地留著。它是最溫和的一種改變方式,而且我們將會看到,它在後果上往往也是最溫和的。
並非所有的單鹼基對換都一樣,化學家把它們分成兩類。回想一下,A 和 G 是兩個更大的、雙環的嘌呤,而 C 和 T 是更小的、單環的嘧啶。轉換把一個鹼基換成同樣形狀的——嘌呤換嘌呤(A 換成 G)或嘧啶換嘧啶(C 換成 T)。顛換則是跨形狀地對換——嘌呤換成嘧啶,或反過來。這種命名並不只是記帳:因為轉換保持了同樣的環形狀,它更容易溜過複製機器,所以即便*可能*的顛換在數目上是轉換的兩倍,轉換在現實中卻大約比顛換多一倍。這種不對稱,是化學在基因組上留下的一枚指紋。
PURINES A G (large, double ring)
PYRIMIDINES C T (small, single ring)
TRANSITION same shape: A <-> G C <-> T (4 kinds)
TRANSVERSION cross shape: A <-> C A <-> T
G <-> C G <-> T (8 kinds)
...so 2x as many transversions are POSSIBLE,
yet transitions actually happen ~2x more often.蛋白質會注意到嗎?同義、錯義、無義
一處點突變會落在基因組的某個地方,但要知道它*做了什麼*,我們得問它落在哪裡、密碼又如何讀它。在一段編碼蛋白質的區域裡,文本是三個字母一組地讀的——每一個三聯體就是一個密碼子,代表一個胺基酸。於是單個鹼基的對換,對蛋白質可能造成三種很不一樣的結果,而這種差別正是關鍵所在。同義突變把密碼子改成一個*同義詞*:得益於密碼的冗餘,好幾個密碼子拼出同一個胺基酸,所以 GAA 和 GAG 都念「麩胺酸」,蛋白質造出來一模一樣。錯義突變把密碼子改成代表*另一個*胺基酸的:蛋白質照樣被造出,但有一個殘基被換掉了,這可能關係重大,也可能幾乎無關緊要,取決於那個殘基是否處在一個要害位置。
第三種結果最為嚴厲。無義突變把一個胺基酸密碼子改成三個終止密碼子之一。沿途讀取的核糖體,撞上一個提前出現的「到此為止」信號,便鬆手放開——於是蛋白質被截短,往往缺掉了那個真正幹活的部分。僅僅一個字母,一整條蛋白質就被截斷了。這就是為什麼同一種編輯——一個鹼基的對換——後果可以從完全不可察覺,一直跨到嚴重致殘:全看這次對換是保住了意思、還是輕輕推了它一下、還是把句子從詞的中間截斷了。最經典的例子是鐮狀細胞病:β-球蛋白基因裡一處單個的 A 換成 T 的顛換,把一個 GAG(麩胺酸)變成 GTG(纈胺酸)——一處錯義改變,一個殘基,紅血球便被深刻地改變了。
加進或丟掉字母:插入、缺失、移碼
到目前為止,我們只是在對換字母。但你也可以*插入*一個或多個鹼基,或者把它們*刪去*——這些統稱為插入缺失。一處小的插入缺失,如果增刪的鹼基數不能被三整除,造成的破壞會比任何單鹼基對換都狠得多。回想一下,密碼是從一個起點開始、以固定的三聯體來讀的;這就是閱讀框。插入或刪去一兩個字母,那個位置*下游*的每一個密碼子就都被重新分組——框架移位了。從那個鹼基往後,核糖體讀到的是一整套完全不同、亂七八糟的密碼子,而且它幾乎總會在不久之後撞上一個終止密碼子。這就是移碼突變,它通常是毀滅性的,因為它打亂了蛋白質餘下的全部,而不只是一個位置。
把它比作按詞閱讀,危險就一目了然了。把「THE BIG RED DOG RAN」三個字母一組地讀,是講得通的。現在刪掉第一個 E,再三個一組地重新分組:「THB IGR EDD OGR AN」——切口之後的每一個詞都成了胡言亂語。相比之下,如果你刪掉的是恰好三的整數倍個字母,框架就保住了:蛋白質少掉(或多出)幾個胺基酸,但其餘部分仍然讀得正確,這就是為什麼一處三鹼基的插入缺失通常遠比一兩鹼基的溫和得多。這裡的教訓是:毀掉訊息的並不是編輯的*大小*,而在於它是否保住了三聯體的節奏。
大多數突變是中性的——而這正是要害
讀過無義突變和移碼突變之後,很容易把一切突變都想成損傷。這個畫面坦白說是錯的,而糾正它,是本篇最重要的一個觀念。攤開在一個真實的基因組上,絕大多數突變是中性的——它們落在非編碼的區段裡,或者是同義的,或者改的是一個無關緊要的殘基——對生物體根本沒有任何可測量的影響。較小的一部分是有害的,就是我們在疾病中注意到的那些。而真正小、卻至關重要的一小撮是*有益*的:它們恰好讓某個蛋白質工作得好一點,或者契合了一種新的環境。這種三分的格局就是適合度譜,而中性的那一大塊,是其中遠為最寬的部分。
下面說說為什麼這不是一條腳註,而是整個故事。變異是演化賴以運作的原材料。沒有突變,就不會有基因的新版本供自然選擇去青睞或淘汰——種群將被凍結,無法適應。罕見的有益改變可以擴散開來;有害的那個通常被淘汰;而數量龐大的中性多數,則安靜地累積下來,在漫長的時間裡,正是這種累積讓我們得以從序列中讀出演化的歷史。那些偶爾致病的、同樣的複製「錯誤」,放到整個物種、放到數百萬年的尺度上去看,正是生命多樣性的引擎。突變不是系統裡的一個故障;它是選擇所能挑選的一切的源頭。
有兩點誠實的限定,能讓這個說法不至於滑向童話。「有益」從來不是絕對的——它指的是*在某一特定環境中*有益,而一旦條件改變,同樣的這處改變就可能變成累贅。而「中性」是關於整個生物體適合度這一層面的陳述,並不是保證這處改變在化學上字面意義地什麼都不做。帶著這份謹慎,這個框架站得住腳:突變就是變異,變異就是機會,而只有其中的一部分機會,在事後、在某個特定情境裡,才顯出是好是壞。這也正是為什麼後幾篇要講修復——細胞投入大量資源,把突變率維持得*低,卻不為零*:修正掉大多數錯誤,又恰好留下足夠的變異,讓生命得以持續變化。