JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

剪接體與可變剪接

真核基因的編碼資訊被內含子打斷,必須精確到單個鹼基地剪除。來認識剪接體——一台主要由 RNA 搭成的機器——並看看把同樣的外顯子以不同方式拼接,如何讓一個基因造出多種蛋白質,悄然讓「一個基因,一種蛋白質」這句老口號退場。

問題所在:一條被打斷的訊息

上一篇裡,你看著一條真核轉錄本在細胞核中、在 前體 mRNA 加工過程中接受了三處大的編輯——前端扣上一頂帽子、後端加上一條多聚 A 尾、中段則把內含子剪除。本篇要打開第三處編輯,也是最戲劇性的一處,並追問:細胞如何以精確到單個字母的準頭把它完成。完成此事的那台機器——[[molbio-spliceosome|剪接體]]——原來是整個分子生物學裡最奇特、也最具啟發性的裝置之一。

回想基因組那一級裡真核基因的佈局:它的編碼資訊並非一氣呵成的連續段落,而是被切成一塊塊。被保留、最終進入成熟訊息的那些塊,是外顯子(想成「被表達的」,expressed);夾在它們之間、被轉錄卻隨即丟棄的那些塊,是內含子(想成「居間插入的」,intervening)。你能在基因的外顯子-內含子組織裡看到它們——外顯子、內含子、外顯子、內含子,如此往復。整個基因連同內含子一起,被抄成前體 mRNA。於是這條原始轉錄本讀起來,就像一句話裡、在真正的詞與詞之間塞進了一長串胡言亂語。

兩個數字讓這個尺度變得鮮活。在一個典型的人類基因裡,內含子通常遠比外顯子長——一個基因可以橫跨幾萬個 DNA 鹼基,可一旦去掉內含子,造出的成熟 mRNA 卻只有區區兩三千個鹼基。而且這刀必須*恰好*落在正確的字母之間:哪怕錯一個鹼基,都會移動閱讀框,從那一點起核糖體讀到的便是徹頭徹尾的亂碼。所以這項任務並非只是「去掉內含子」——而是每一次都要以單核苷酸的精度、按正確的順序,把每一個內含子剪掉。

標明在哪裡下刀的三處記號

在幾萬個字母當中,機器怎麼知道一個內含子從哪裡開始、到哪裡結束?它讀三處短小的路標——幾乎每個內含子都帶著的兩個[[splice-sites-and-branch-point|剪接位點]]與一個分支點。幾乎每個內含子的前端都以鹼基 GU 起頭(5' 剪接位點,即供體),後端都以 AG 收尾(3' 剪接位點,即受體)。這就是 GU-AG 規則。在 3' 端再往前一點的位置,坐著分支點:一個特定的腺嘌呤(A),它將充當一個鉸鏈。這三處記號合起來,等於在說:「內含子從這裡開始,樞軸在這裡,內含子到這裡結束。」

  exon 1            INTRON  ( cut me out )              exon 2
5'...---[ A G | G U ........ A ........ A G ]| C C ---...3'
              ^5' site      ^branch    ^3' site
              (GU donor)    point A    (AG acceptor)

  the spliceosome joins exon 1 --- exon 2 and frees the intron
一個一般的內含子:以 GU 開頭,以 AG 收尾,並在近 3' 端處帶一個分支點 A。剪接體在兩個 | 處下刀,並把兩側的外顯子連接起來。

正是這些路標讓剪接得以精確——也正是它們讓剪接變得脆弱。一個破壞掉某個 GU 或 AG 的單點突變,或是一個在外顯子內部意外造出*新* GU 或 AG 的突變,都可能讓機器在錯誤的位置下刀、毀掉蛋白質。這類剪接位點突變,是遺傳病一個重要、卻常被忽視的成因:一個遠離任何編碼字母的鹼基改變,仍可能僅僅因為破壞了剪接方式而毀掉一個基因。這也是一個誠實的理由,說明只盯著編碼字母看的老習慣,會漏掉真正致病的改變。

剪接體:一台主要由 RNA 造成的機器

意外就在這裡。你也許以為這刀該由蛋白質酶來下——畢竟細胞裡大多數化學反應都是蛋白質幹的。但剪接體主要由小核 RNA搭成,那是一些短小的 RNA 分子(叫做 U1、U2、U4、U5、U6),每一條都裹著一組蛋白質,組成一個叫 snRNP(「小核核糖核蛋白」,讀作「斯納普」)的顆粒。幾個 snRNP 按既定順序組裝到內含子上;而關鍵在於,是這些 *RNA*——不是蛋白質——靠鹼基配對去識別剪接位點,並坐鎮於化學反應發生的催化中心。蛋白質是腳手架和幫手;真正幹活的核心,是 RNA。

把這次組裝看成一連串「識別」。U1 最先到來,與 5' 端的 GU 位點配對,標出內含子的前端。接著 U2 與分支點配對,刻意把那個特殊的分支 A 鼓向外側,使它具反應性的「手臂」露出來、隨時待命。一個預先組好的三件套——U4/U6 加 U5 顆粒——前來加入,把內含子的兩端拉到一起;隨後一次劇烈的重排把 U1 和 U4 甩出去,U6 接管前端,而 U5 把兩個外顯子的末端對齊扶穩。只有在這番重新洗牌之後,那個由 U6 與 U2 的 RNA 構成的催化中心,才被啟動。這台機器不是一把靜止的剪刀;它在每一個內含子上都重新把自己搭起來,核對記號,然後才下定決心動刀。

兩刀與一個套索:化學是怎麼發生的

組裝完成後,剪接體只用兩步化學反應就把內含子去掉——而讓它精確的訣竅在於:這兩步是*同一種*反應,即由 RNA 的某一部分去攻擊另一部分、交換原子之間的鍵。跟著這兩步走,那個著名的環——套索(lariat,得名於牛仔的套索繩)——便會從幾何關係裡自然現身。

  1. 第一刀。分支點 A 有一條自由的化學「手臂」(它的 2'-OH),剪接體早已讓它對準內含子的前端。這條手臂攻擊 5' 端的 GU 位點,把那裡的鏈一刀切斷。被切下的內含子前端並不飄走——它反過來接到內含子中段的分支點 A 上,把內含子扭成一個帶著拖尾的閉合環。這個「帶尾的環」就是套索。
  2. 第二刀。把前端切鬆之後,外顯子 1 自己也多出一個自由端。這個端如今擺過去,攻擊 3' 端的 AG 位點,也就是內含子的尾巴。這第二刀把內含子徹底釋放——仍是套索的形狀——並在同一個動作裡,把兩個外顯子首尾相接、不留縫隙地連上。閱讀框被一字不差地保住了。
  3. 收尾。被釋放的套索被解開(去分支)成一條直鏈,隨即被降解,其核苷酸得到回收。剪接體的各個 snRNP 拆散開來,到下一個內含子那裡重新使用。少了一個內含子的成熟 mRNA,則繼續往前走。

退一步看剛剛發生了什麼:整件活兒都由 RNA 剪接完成——是 RNA 識別 RNA、RNA 催化那兩刀。沒有靠水去盲目地砍斷鏈條;細胞反而是在一次受控的交換裡重用自己的鍵,正因如此,刀口才恰好落在正確的字母之間、從不差一個鹼基。套索並不是失誤或殘渣——它正是那次分支點攻擊留下的直接指紋,是第一刀如何下成的可見證據。

可變剪接:一個基因,多種蛋白質

現在來看回報,也是這之所以是整個領域最重要的觀念之一的緣由。沒有任何東西強迫細胞每一次都保留每一個外顯子。透過選擇跳過某個外顯子、或納入一個額外的外顯子、或改用另一個剪接位點,剪接體就能從*同一條*前體 mRNA 出發,把*同一套*外顯子以*不同*的組合拼接起來。每一種組合都是一條不同的成熟 mRNA,於是就是一種不同的蛋白質。這就是[[molbio-alternative-splicing|可變剪接]];在人類身上,它是常態而非例外:我們絕大多數的多外顯子基因,都不止以一種方式被剪接。

把外顯子想成一組編號為 1、2、3、4、5 的樂高積木。某種細胞也許搭出 1-2-3-4-5 這條訊息;另一種細胞也許跳過第 3 塊、搭成 1-2-4-5;第三種細胞也許保留第 2 塊的另一個版本。身體一直在這樣做。一個肌肉細胞和一個腦細胞可以執行同一個基因,卻各自造出微妙不同、各得其所的蛋白質;而一個著名的、參與構建神經系統接線的果蠅基因,從單單一段 DNA 出發,原則上可以被剪接出數以萬計互不相同的蛋白質。同一個基因;不同的剪刀活兒;不同的產物。

是什麼決定一個細胞造哪一個版本?調控蛋白會結合在剪接位點附近,要麼誘導某個 snRNP 去使用一個位點(增強它),要麼把那個位點藏起來(沉默它)。由於這些調控因子在不同細胞之間各不相同、又隨細胞的狀態而變,剪接便成了基因表達之上的又一層控制——不只控制一個基因*是否*被讀取,更控制它的蛋白質以*哪種形式*出現。細胞甚至把剪接接到自己的品質控制上:故意剪進一個提前的終止密碼子,就給這條訊息打上無義介導降解的標記,從而把這個基因的產出調低。一言以蔽之,剪接絕非單純的整理——它是細胞所做的一項決定。

為何重要:「一個基因,一種蛋白質」之死

在基因組被定序之前,生物學家揣著一句俐落的口號:一個基因,一種蛋白質。隨後來了一記真切的震撼。人類基因組計畫發現,我們只有大約兩萬個編碼蛋白質的基因——比一條小小的線蟲多不了多少,甚至比某些植物還少。人們本以為要有大得多的數目,才能解釋一個人。可變剪接是這道謎底的重要一環:數目不多的基因,每一個都可被剪接成若干種蛋白質,就能指定一個比基因數目大上數倍的蛋白質組。那句口號乾脆就是錯的。誠實的版本是:一個基因,*往往是多種蛋白質*。

這也化解了一種更老的偏見。那些不惜代價被丟棄的內含子,曾被斥為浪費、甚至「垃圾」——可恰恰是內含子的存在,才使可變剪接成為可能;而把基因切成一塊塊模組化外顯子,才讓演化得以混搭功能部件。這後一個想法——[[exon-shuffling|外顯子洗牌]]——是真實而有力的:由於外顯子常常對應於緊湊的蛋白質結構域,把一個外顯子從某個基因挪進另一個基因,就能一步之內給一個蛋白質添上一整個全新的工作模組。所以,一種看似雜亂而浪費的佈局,細讀之下,竟是多樣性的發生器。