JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

新基因從何而來

基因組不是一段固定的文本,而是一間不停發明的作坊。來看看演化的新意在分子層面究竟從何而來——複製一個基因、讓其中一份去遊蕩,把蛋白質模組拼接起來,甚至整段地從毫不相干的生物那裡引進基因。

刻在 DNA 裡的「創新者困境」

走到階梯的這一步,你已能把基因組當作一份歷史文獻來讀,並能透過比較物種,辨認出演化拒絕改動的是哪些字母。但這引出一個更尖銳的問題:如果每一個要緊的字母都被選擇守護著、悄悄移除一切有害的改動,那麼任何*新*東西又是怎麼被造出來的?基因組面對的,是一個貨真價實的「創新者困境」。已經在工作的那個基因彌足珍貴——若你給自己唯一一份關鍵酶的基因來個突變,最後很可能落得一點酶都沒有。所以演化不能簡單地把一個能用的基因改寫成一個新基因;那些中間步驟往往是壞掉的、致命的。真正的新意,需要一條能讓你*放心*試驗、卻不必押上唯一那份能用拷貝的路。

演化逃出這個陷阱的辦法,妙就妙在毫無想像力:備一份、把現成的零件拼一拼,或者向鄰居借一段。這裡沒有什麼總設計師在運籌——只有幾樁馬虎的複製與重組事故,在漫長歲月與一整個供篩選的族群之下,偶爾撞上了有用的東西。本篇就來走一遍主要的路徑。新基因主要透過三條途徑產生:複製一個現成的基因、讓其中一份漂變去做新工作;透過外顯子混編,把現成的蛋白質模組拼成全新的組合;以及透過[[molbio-horizontal-gene-transfer|水平基因轉移]],在毫不相干的生物之間整段地搬運基因。而貫穿這一切之下的,是那些能移動的 DNA 片段——[[transposable-element|轉座元件]]——它們既攪亂基因組,又時不時地給基因組捐獻原料。它們沒有一個是設計師;每一個都是事故,只不過被選擇偶爾留了下來。

備一份:複製與分化

新基因最重要的一台引擎,是[[gene-duplication-divergence|基因複製,繼之以分化]]。第一步是個老實的錯誤:在複製或重組時哪裡一打滑,一段 DNA 被抄了兩遍,於是原本一份的基因,變成了並排的兩份拷貝。在那一刻,兩份拷貝完全相同、彼此冗餘——生物體扛著一份它並不需要的備份。而冗餘,恰恰就是先前缺失的那份自由。原版還在幹著活,那份備用拷貝便不再受選擇守護:若只有單份拷貝時必定致命的突變,如今在它身上無害地累積起來,因為原版頂著這班。備份得以自由遊蕩。

接下來會發生什麼,常見的有三種結局,而對它們各自的機率誠實以對很要緊:大多數備份是輸家,不是贏家。最最常見的命運是衰敗——那份被解放的拷貝撿到一個致命的終止密碼子或一次移碼,爛成一個[[gene-families-and-pseudogenes|假基因]],一具有基因形狀、卻不製造任何蛋白質的化石。稍少見的是,兩份拷貝靠著把原版的職責*分攤*而雙雙存活,各自留住舊工作的一部分(亞功能化)。而極罕見地——人人都記得的那個幸運例外——被解放的拷貝漂變出一項真正*嶄新*的功能,隨後被選擇青睞並固定下來(新功能化)。把這個過程在數億年裡重複下去,一個祖先基因就長成一整個由親緣拷貝組成的基因家族。運送氧氣的珠蛋白基因、支撐色覺的視蛋白、那一大片片的嗅覺受體——全是由複製與分化、從單一祖先鑄造出來的家族。

one ancestral gene  -->  accidental duplication  -->  two identical copies

   [GENE]                                          [GENE][GENE]
                                                       |     |
                                          original kept |     | spare now free to mutate
                                                        v     v
  three common fates of the spare copy:

   1.  most often  ->  STOP / frameshift  ->  pseudogene   (dead relic, no protein)
   2.  sometimes   ->  duties split        ->  two genes share the old job
   3.  rarely      ->  drifts to new role  ->  NEW GENE  (kept by selection)

  repeat over deep time  ->  a gene family of related paralogs
一份被複製基因的命運圖。冗餘把備用拷貝從選擇中解放出來;它通常衰敗成假基因,偶爾職責一分為二,極少數情況下撞上一項全新的功能——成為一個基因家族的種子。

拼零件:外顯子混編

複製是把現成的抄下來再微調;第二台引擎則做*重組*。要看清它,先回想前面幾級裡的兩件事。其一,大多數真核基因是被切開的:叫做外顯子的編碼段,被一段段長長的非編碼內含子打斷,而內含子會從 RNA 裡被剪掉。其二,蛋白質很少是一整坨——它由半獨立的模組搭成,就是那些[[protein-domain|蛋白質結構域]],每一個都是一個做一件事的緊湊摺疊,好比瑞士軍刀上的刀片、螺絲刀和剪刀。妙就妙在一個巧合:外顯子常常大致對應著這些結構域——一個外顯子可能編碼一段會結合鈣的部分,另一個則編碼一段錨定到膜上的部分。

把這兩件事湊到一起,一條通往新意的捷徑就現身了。由於外顯子*之間*的內含子又長、又容得下改動,DNA 可以在一個內含子內部斷開、再重新接上,而絲毫不驚動外顯子的編碼部分。於是當重組偶然把一個外顯子——或一整塊外顯子——從一個基因搬進另一個基因,接收方的蛋白質就*一步之間*獲得了一整個、已經過驗證的功能結構域,比一個字母一個字母地把那個結構域演化出來快得多。這就是[[exon-shuffling|外顯子混編]]:靠把驗證過的模組以新組合拼接到一起來造新蛋白質,活脫脫就像你從別的設備上拆下一台馬達、一個夾鉗和一個傳感器,拼出一台新機器。

外顯子混編有助於解釋,複雜的多結構域蛋白質為何在動物歷史上來得如此突然。血液凝固的蛋白質和免疫系統的蛋白質都是教科書式的鑲嵌體——由基因組各處借來的、反覆出現的結構域拼綴而成,同一批模組被混編進許多不同的蛋白質裡,彷彿同一份零件目錄裡的條目。它與複製配合得恰到好處:複製是把一整個基因抄下來再打磨,混編則是*跨著*基因把碎片重組起來。不過有個老實的提醒——混編是通往新結構域組合的一條重要路徑,卻不是唯一一條,而它究竟造就了蛋白質中多大的比例,仍有爭議,且因譜系而異。

向鄰居借:水平基因轉移

複製與混編,都是在一個譜系*內部*重新加工已有的材料。第三台引擎則徹底打破了這道界線。在[[molbio-horizontal-gene-transfer|水平(或稱側向)基因轉移]]裡,一個基因在並非親子關係的生物之間*橫向*移動——有時甚至在親緣關係遠到分處生命之樹不同枝杈上的物種之間移動。你不是從祖先那裡縱向繼承一個基因,而是乾脆從一個同時代的生物那裡弄來一個,現成的、而且已經在工作了。對微生物而言,這不是什麼罕見的稀奇事,而是一種生活方式,也正是抗生素耐藥性能在幾個月、而非幾千年裡傳遍一個細菌族群的主因:一個耐藥基因,打包在一小圈 DNA 上,從一個細胞跳到下一個細胞。

  1. 供體細胞釋放出 DNA——它可能從一個死細胞裡滲出,可能搭乘在細胞間傳遞的一小圈 DNA(質粒)裡,也可能由一種感染細菌的病毒載著走。
  2. 一個受體細胞把這段外來 DNA 接納進去,越過了我們通常想象中那道牢固的物種邊界。
  3. 這段新 DNA 若要長存,就必須整合或被維持——靠重組嵌入染色體,或作為一個能自我複製的質粒保留下來,在每一次分裂時一同搭車。
  4. 隨後由選擇來評判這位新來者:若它的蛋白質有用——抵抗一種藥物、消化一種新食物——這個基因就會橫掃整個族群;若沒用,便會丟失。

水平轉移,對「生命只有一棵樹」這幅簡單圖景也構成了真正的挑戰。前幾篇的整套邏輯都假定基因是縱向傳承的,於是一個基因的歷史*就是*生物的歷史——把同源序列排齊,讀出一棵分叉的樹。可如果基因會橫向跳躍,那麼同一個微生物裡的不同基因,就能講出*不同*的祖先故事,根本沒有哪一棵樹是它們全都認帳的。這正是為什麼由緩慢變化的核糖體 RNA 搭建起來的[[three-domain-tree|三域樹]],越靠近樹根越模糊:早期微生物之間的交換實在太多,最深處的親緣關係看上去不像一道乾淨的分叉,倒更像一叢纏繞的灌木。對轉移罕見的動物和植物來說,這棵樹仍是個極好的模型——可對細菌和古菌,老實說,它是鋪在一張網上的一個近似。

跳躍基因,與基因組如何長大

在這一切之下湧動的,是一類躁動不安、能自行移動的 DNA。[[transposable-element|轉座元件]]——芭芭拉·麥克林托克所說的「跳躍基因」,早在人們相信基因組能自我重排之前數十年,就在玉米裡被她發現了——是一段段攜帶著指令、能把自己複製出來或剪下來、再插到別處去的 DNA。有些靠剪切—貼上移動:它們編碼的一種酶把元件切出,再貼進一個新位點。另一些則經由一個 RNA 中間體、靠複製—貼上移動:元件先被轉錄成 RNA,再由[[molbio-reverse-transcriptase|逆轉錄酶]]把那段 RNA 在一個新位置抄回 DNA——原件留在原地,於是數目只增不減。(那一步 RNA 到 DNA 的轉換,正是 HIV 這類逆轉錄病毒所用的招數,也俐落地提醒我們:中心法則從未禁止資訊從 RNA 倒流回 DNA。)

這些元件可不是什麼罕見的怪胎——它們佔了人類基因組的大約*一半*,是基因組如此龐大的頭號原因。而它們也重塑了我們對「基因組如何長大、如何創新」的理解。多數時候,它們複製—貼上的習性只是用重複序列把基因組撐大,偶爾某次跳躍落進一個基因裡、把它弄壞,引發疾病。但恰恰是同一種活動,也是新意的一眼靜水之泉:一個轉座子能把宿主的一個外顯子帶到一個新基因裡(外顯子混編的一門近親),而在演化的長河裡,它的序列一次又一次被*馴化*成有用的新調控開關——甚至被馴化成名正言順的宿主基因。比方說,把我們抗體基因縫合到一起的那些蛋白質,就源自一個被馴服的轉座子。跳躍基因最好別被讀作純粹的寄生者、也別讀作純粹的工具,而應讀作一股威力強大的雙刃之力:它既威脅著基因組的穩定,又充當著基因組演化的一台主引擎。

從序列裡讀出新意

退後一步,這四種機制便排成了同一個主題的幾個變奏——在不押上唯一能用拷貝的前提下創新。複製是備一份、放它去遊蕩。外顯子混編是跨著基因把驗證過的模組重組。水平轉移是從鄰居那裡借來一個成品基因。而轉座元件則四處撒下可供馴化的原料。每一種情形裡,基因組都是在邊緣處、低成本地試驗,而那些能用的原版照舊亮著燈——再由選擇這位耐心的編輯,留下罕見的成功、丟棄常見的失敗。這裡沒有發明家;只有複製、重組,以及一個在漫長歲月裡篩選結果的族群。

之所以說這是演化這一級一個合宜的收尾,是因為上述每一樁事件,都在序列裡留下了一道可讀的疤痕。一簇旁系同源基因,是一次被當場逮住的複製;一個由熟面孔結構域拼綴而成的蛋白質,洩露了它混編而來的出身;一個其祖先與宿主之樹意見相左的基因,標記著一次水平跳躍;而一個轉座子那些洩底的重複序列,則標出了 DNA 曾經落腳之處。比對 DNA 與蛋白質序列——也就是這一整級的手藝——不只揭示親緣、為遠古事件標定年代。它還讓你親眼看著新基因誕生,被一樁事故一樁事故地寫進基因組自己的歷史檔案,並由選擇留存下來。