JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

同源性:直系同源與旁系同源

相關的基因,把一部家族史寫在了它們的序列裡。學著讀懂它——並弄清為什麼分清直系同源(不同物種裡的同一個基因)與旁系同源(同一基因組內的基因拷貝),正是那一招,讓一個在酵母裡研究透徹的基因,照亮你身上那個一模一樣的基因。

相似,並不等於同源

在上一篇裡,你學會了把兩條序列並排擺開、量出它們有多像。可單憑「像」,不過是個數字——而且是個粗心的數字。這門領域真正在意的那個詞,是[[sequence-homology|同源性]],它帶著一種精確、近乎法律的含義:兩個基因若*源自同一個祖先基因*,便是同源的。同源是關於歷史的斷言,而非關於外貌的斷言。兩條序列看上去有 35% 相像,可能是因為它們真的共享一個祖先,也可能只是因為,在僅有四個字母可選的情況下,偶然給了它們一抹擦肩而過的相似。所以謹慎的生物學家從不說兩個基因「70% 同源」——同源是非此即彼的,那段祖先要麼共享、要麼不共享。你*測量*的是相似性;從足夠多的相似性裡*推斷*出來的,才是同源性。

為什麼非要死守這個區分?因為同源性,是整個比較生物學得以跨越的那座橋。如果一個人類基因和一個酵母基因是同源的,那麼關於酵母那一版所辛苦學到的一切——它的結構、它的搭檔、它在細胞裡幹的活——就都成了對人類那一版極有力的第一猜測。那座橋之所以立得住,全因這兩個基因*是同一個基因*:它們繼承自一個或許生活在十億年前的共同祖先,從那以後,在兩條譜系裡都一直幹著可辨認地相同的工作。僅僅長得像,給不了你這樣一座橋。所以同源性不是咬文嚼字;它是那張許可證,讓知識根本得以在物種之間穿行。

基因分岔的兩種方式:物種分化與基因複製

同源基因是親戚,而像任何家族一樣,親緣關係取決於這個家族*是怎麼*分枝的。能把一個基因變成兩份相關拷貝的事件,恰好只有兩種,而這篇全部的詞彙,都繫在分清這兩者之上。第一種是物種分化:一個祖先種群一分為二、成為兩個物種,它當初攜帶的那個單一基因,便沿兩條譜系各自遺傳下來。一個基因、兩個物種——這一對,就是一組[[ortholog-paralog|直系同源基因]](希臘語 *orthos*,「筆直」)。第二種是[[gene-duplication-divergence|基因複製]]:在單一基因組內部,一段 DNA 被意外地複製,於是*同一個*生物體裡就有了並排的兩版。一個基因組、兩份拷貝——這一對,就是一組旁系同源基因(*para*,「在旁邊」)。

要真切體會其中的差別,最乾淨的辦法是畫出這個基因的家譜。設想一個祖先基因 G。很久以前,它在某一個基因組內部複製成 G-α 和 G-β——如今是同一生物體裡的兩個旁系同源基因。*後來*,那條譜系因物種分化裂成比方說人和小鼠,兩份拷貝都各自遺傳了下去。結果就是四個當今的基因:人-G-α、鼠-G-α、人-G-β、鼠-G-β。人-G-α 與鼠-G-α 是直系同源(它們的線在人鼠物種分化處分開)。但人-G-α 與人-G-β 是旁系同源(它們的線在遠古那次複製處就分開了,那時物種尚不存在)。同樣的四個基因,兩種截然不同的表親——而只有那棵樹,才告訴你誰是誰。

                ancestral gene G
                       |
              DUPLICATION (one genome)
                /             \
            G-alpha          G-beta
               |                |
          SPECIATION       SPECIATION
           /     \          /     \
     human     mouse   human     mouse
     G-alpha   G-alpha G-beta    G-beta

  human G-alpha  vs  mouse G-alpha  ->  ORTHOLOGS  (split by speciation)
  human G-alpha  vs  human G-beta   ->  PARALOGS   (split by duplication)
同一棵基因樹裡,同時容著兩種親戚。看兩個基因的線在哪裡分岔:在物種分化結點分開,是直系同源;在複製結點分開,是旁系同源。

為什麼這個區分能左右功能與歷史

這不只是記帳——弄錯了,會把你引向錯誤的結論。直系同源與旁系同源在分開之後,往往行為大不相同,而原因在於選擇。當一個基因因物種分化裂成直系同源時,*兩條*子譜系都依舊需要這個基因去幹它那一份活;從前保守了它的那同一種純化選擇,會在每個物種裡繼續保守它。所以直系同源通常保持相同的功能。可當一個基因因複製裂成旁系同源時,這個生物體突然多了一份備份。一份拷貝可以繼續擔起原來的職責,另一份則從約束中被解放,得以自由漂變、去嘗試那些若只有單份拷貝時必定致命的事。因此旁系同源*常常在功能上分道揚鑣*。這被生物學家凝練成一條工作法則,稱為直系同源猜想:在一個基因所有的親戚裡,它的直系同源是共享其功能最穩妥的賭注——在工作上,通常比它自家基因組裡的旁系同源還要更近。

現在想像那個實際的陷阱。你測了人類一個新的致病基因的序列,想在某種模式動物裡研究它。你把它拿去 BLAST 比對果蠅基因組、抓下排名最高的那條命中——可單看原始相似性的最高命中,也許是你這個基因的一個*旁系同源*:它早已漂向了另一種角色,而非它真正的*直系同源*。把實驗建在這樁錯配上,你就會去研究錯的那個蛋白質,然後「發現」一個傳不回去的功能。同樣的失誤也會扭曲演化歷史:把一對旁系同源當成一對直系同源來數,你就會在物種樹上把一條分枝放錯位置——把一次遠古的基因複製讀成一次物種分化,把那次分岔定到完全錯誤的紀元去。親緣關係的類型是承重的;認錯了它,建在其上的生物學與歷史便一同坍塌。

旁系同源:演化如何起草新基因

旁系同源值得細看,因為它們不折不扣就是演化創造新意的主要作坊。一個新基因幾乎從不憑空從一段空白 DNA 裡冒出來;遠更常見的是,它是一個舊基因的拷貝,被改作他用。這個經典故事分三幕上演。第一幕,複製給基因組遞上一份多餘的備份。第二幕,這份備份擺脫了選擇——而多數時候,這份自由是致命的:突變無人約束地累積,直到這份拷貝再也造不出能用的蛋白質,於是它衰敗成一個[[gene-families-and-pseudogenes|假基因]]——一具沉默的化石,序列裡仍可辨讀,卻不再被表達。第三幕——罕有而珍貴地——一份被解放的拷貝在死去之前撞上一個有用的新花樣,選擇一把抓住這項改進,於是一個真正嶄新的基因,便在舊基因身旁誕生。

把這個循環在漫長歲月裡重複,一個祖先基因便綻放成一個基因家族——一整支源自同一個原型的旁系同源戲班。教科書式的例子是珠蛋白。一個孤獨的祖先攜氧基因一次又一次地複製,它的旁系同源各自專門化:一種胚胎型,一種為隔著胎盤拉氧而調校的胎兒型,一種成人型,還有把氧藏在肌肉裡的肌紅蛋白。它們顯然是親族——把它們的序列排齊,共同的祖先一望即明——可每一個都幹著微妙不同的活,每一個都是一份曾經得以自由試驗的備份拷貝的產物。讀懂一個基因家族內部的相似性模式,你幾乎就是在直接讀出它那些複製發生的先後次序:最深的分岔分開分化最遠的成員,最淺的分岔分開最年輕的孿生。

從酵母到人:把同源性當作工作的工具

現在輪到那個讓這套詞彙配得上其分量的回報了。回想這條階梯很早處講過的、我們為何倚重[[molbio-model-organism|模式生物]]——酵母、果蠅、線蟲、小鼠——而不直接在人身上研究一切:它們便宜、快速,倫理上也簡單得多。同源性,正是這套策略根本行得通的原因。一個細胞的核心機器——DNA 如何被複製、細胞週期如何計時、蛋白質如何被摺疊和運送——大體上是在我們共同的祖先裡就已敲定,並從那以後一直保守至今。所以在酵母裡運行這些過程的基因,在人類身上有著幹著一模一樣工作的直系同源。在酵母裡研究那個基因——在那裡你可以隨意突變它、看著細胞如何回應——你便擁有了它那個人類直系同源的一份詳盡工作模型,那是你在人類細胞裡永遠建不起來的。

這座橋有多牢靠?有時牢靠得驚人。研究者曾把人類的基因放進那些自身直系同源已被刪除的酵母細胞裡——在數以百計的案例中,那個人類基因頂了上來、救活了酵母,把活幹得足夠好,跨越約十億年的分隔仍讓細胞存活。這就是被坐實了的同源性:不是一抹淡淡的家族相像,而是一個仍能在生命之樹上互換的零件。癌症生物學正是這樣從酵母的細胞週期基因裡生長出來的,無數人類疾病的機器,也正是這樣最先在那些本身並無這些疾病的生物裡被剖解開來的。

兩句誠實的告誡,使這件工具不致被濫用。其一,*序列*的保守只是從概率上、而非從法則上,意味著*功能*的保守——直系同源偶爾也會撿起新角色,而一次只在某個物種裡留下旁系同源的複製,就能悄悄打亂原本整齊的一一對應。其二,這幅簡單圖景假定基因是嚴格地由親代傳給子代的。在細菌和古菌裡,這個假定會破裂:通過[[molbio-horizontal-gene-transfer|水平基因轉移]],基因會在毫不相關的微生物之間橫向跳躍,於是一個基因的歷史,可能與它宿主的歷史急劇分岔。所以同源性是一個有力、且有充分理據的第一猜測——是一項實驗的發射台,而絕非它的替代品。這樣來對待,那個簡單的舉動——認出兩個基因共享一個祖先——便仍是整個生物學裡最不動聲色卻最有力的觀念之一,是把每一個基因組串成一個連綿故事的那根線。