JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

剪接與加工:編輯這條信息

剛抄出來的轉錄本只是一份草稿,還不是成品信息。來認識每條真核 mRNA 都要經歷的三道編輯——前端加帽、後端加尾,以及那場轟轟烈烈的剪切與黏接(剪接)——並看看這種編輯如何讓一個基因造出好幾種蛋白質。

一份草稿,而非成品信息

在上一篇裡,你看著轉錄跑了一遍:一種酶沿著基因爬行,一個字母一個字母地拼出一條嶄新的 RNA 鏈。人很容易以為活兒幹完了——基因都抄好了,細胞當然可以直接讀它、造出蛋白質。在細菌裡,這幾乎成立。但你不是細菌,在你的細胞裡,那條新鏈離「可用」還差得遠。從基因上滾下來的,是一份未經編輯的原始草稿,叫做 pre-mRNA——一條初級轉錄本,任何核糖體都絕不會被允許照原樣去讀它。

為什麼要這麼多周折?有兩個原因,而且都繞回到你在前面一級裡遇到過的那堵牆:細胞核。在真核生物裡,轉錄在細胞核內進行,造蛋白質卻在核外、在細胞質裡進行。於是這條信息必須熬過一段旅程——穿過核孔出去,再穿越一個擠滿了會啃食散落 RNA 的酶的繁忙細胞。一份赤裸裸的草稿還沒到達就會被切碎。除此之外,基因本身寫得很亂,有用的文字被一長段一長段必須剪掉的填充物打斷。給草稿做編輯,一舉解決了這兩個問題。

於是細胞讓這份草稿走上一條編輯流水線。三道編輯把原始的 pre-mRNA 變成一條成品的、可外運的信使 RNA——前端一頂保護性的帽、後端一條保護性的尾,以及中段一次精確的剪切與黏接。本篇就按順序走一遍這三道工序,並以那個讓整套機器值回票價的回報收尾:一個基因悄悄造出好幾種不同的蛋白質。

封住兩端:帽與尾

想像寄一份易損的文件。在它離手之前,你會封住前端,讓什麼都咬不進去,也讓收件人知道該從哪裡開始。這就是 5′ 帽:一個特殊的、經過修飾的核苷酸,被裝到轉錄本最前端(5′ 端)上。它裝得出奇地早——轉錄還在進行時,幾乎是 RNA 的前端剛從聚合酶裡探出來就裝上了。這頂三重地發揮價值:它保護前端免遭啃食 RNA 的酶,它充當細胞抓著把 RNA 經核孔運出去的「把手」,它還是核糖體隨後尋找的對接信號,好知道該從哪裡開始讀。

後端也有它自己的保護:poly-A 尾,一長串單一的 RNA 字母——腺嘌呤 A——常常一兩百個 A 連成一排,接在 3′(後)端上。這裡有個意外:這些 A *不是*從基因上抄來的。在轉錄本接近末尾處,細胞認出一段信號序列,在那裡把 RNA 切斷,再由一種專門的酶事後簡單地接上那串 A。隨後一些特殊蛋白包裹這條尾巴,而真正幹活的是這層蛋白外衣——不是那些光禿禿的 A。一條又長又包裹良好的尾巴意味著一份穩定、會被讀很多次的信息;隨著尾巴在信息的一生中被慢慢啃短,這條 mRNA 便漂向被銷毀。這條尾巴實際上是一根緩慢燃燒的引信——一個細胞可以設定的有效期計時器。

剪接:剪掉填充物

現在輪到那場轟轟烈烈的編輯了,發生在中段的那一道。回想一下基因組那篇裡的意外:在你的 DNA 中,真正編碼蛋白質的只是薄薄一條,而單個基因裡編碼的部分甚至不是連續的。在一個真核基因內部,有意義的編碼片段被切碎,被一長段一長段的填充物隔開。想象一段錄下來的演講,講者在精彩句子之間不停地東拉西扯。為得到乾淨的版本,編輯剪掉每一段跑題的內容,再把精彩的句子按順序黏接回去。這種剪輯就叫剪接

這兩類片段各有名字,還配得上一個小小的助記。外顯子(exon)是被「表達」(EXpressed)出來的片段——它們留在最終信息裡。內含子(intron)是「居間」(INtervening)的片段——夾在外顯子之間、會被移除的填充物。一條嶄新的 pre-mRNA 兩者兼有,沿其長度交替排列;剪接剪除每一個內含子,把外顯子首尾相接封合起來,留下一條連續的編碼信息。所需的精度令人咋舌:剪切必須精確到單個字母,因為哪怕錯一個,下游的每一個詞都會移位,把整個蛋白質攪得一團亂。

  pre-mRNA  (raw draft, straight off the gene):

  cap-[ exon1 ]--intronA--[ exon2 ]----intronB----[ exon3 ]-AAAA...
           |        (cut)      |          (cut)       |
           +------------------>+--------------------->+
                       exons joined, introns dropped

  mature mRNA  (ready to export and read):

  cap-[ exon1 ][ exon2 ][ exon3 ]-AAAA...
一圖看懂剪接:內含子被甩成環、丟棄,外顯子按順序接好,帽與尾把成品信息夾在中間。抗肌萎縮蛋白基因是極端例子——其原始轉錄本的 99% 以上都是內含子,被剪掉了。

在往下走之前,先說兩點誠實的提醒。其一,「外顯子」並不等於「編碼蛋白質」——外顯子也包括 mRNA 兩端不被翻譯的片段,所以外顯子只是一段在剪接中倖存下來的片段,未必是編碼蛋白質的。其二,內含子並非純粹該被丟棄遺忘的垃圾:有些攜帶調控信號,而正是「能把它們剪掉、再把外顯子重接起來」這一能力,恰恰解鎖了下一節裡的把戲。

剪接體:一台由 RNA 驅動的剪切—黏接機器

以單字母的精度、在數以萬計的不同基因上、重複數百萬次地剪切——細胞不會把這事交給運氣。它動用一台龐大的、能自我組裝的機器,叫做剪接體。讓它與眾不同的轉折在於:剪接體並不像細胞裡大多數機器那樣主要由蛋白質構成。它的核心工作部件是一些小 RNA 分子(與蛋白質一起包裝成綽號叫「snurp」的單元)。是 RNA 在負責識別——甚至負責剪切與連接的那道化學反應。

  1. 在每個內含子上,剪接體現場組裝,由它的 RNA 部件識別那些標出內含子起止位置的「路標」字母。
  2. 它把內含子折出一個像牛仔套索一樣的環,讓兩側的外顯子靠攏到一起。
  3. 它把內含子剪下來,再把兩個外顯子封合(連接)成一條連續的鏈。
  4. 它解體並回收部件,準備在下一個內含子上把整套舞步再跳一遍。

剪接體的催化核心是 RNA 而非蛋白質,這是一條真正深刻的線索。一個充當酶的 RNA 分子叫做核酶,它告訴我們:RNA 既能*攜帶*信息,又能*驅動*化學反應——這正是生命在蛋白質主導之前得以起步所需要的。這同一台機器也常常是故障點:當剪接體或它所讀取的信號出錯時,外顯子會被錯誤地跳過或保留,後果中就包括真正的人類疾病——某些肌萎縮、某些癌症。諾西那生(nusinersen)等現代藥物的起效方式,是促使剪接體保留一個它本會丟棄的關鍵外顯子——修的是*剪輯*,而非基因本身。

一個基因,好幾種蛋白質:回報

現在輪到那個讓所有這些編輯值回成本的回報了。剪接並非每次都被迫用上每一個外顯子。設想同一本說明書,只要選擇保留哪幾頁、跳過哪幾頁,就能組裝成自行車、滑板車或獨輪手推車。這正是那一招——可變剪接:從*同一條* pre-mRNA 出發,剪接體可以在一種細胞裡保留某些外顯子,在另一種細胞裡把它們略去,由單個基因產出不止一種成品 mRNA——也就是不止一種蛋白質。這些相關卻有別的版本被稱為異構體。

這解開了基因組那篇留下的一個懸念。人類只有約兩萬個編碼蛋白質的基因——勉強比一條小小的線蟲多一點——可我們造出的蛋白質卻多得多、也豐富得多。可變剪接是答案的很大一部分:我們絕大多數含多個外顯子的基因都會以不止一種方式剪接,因此基因的*數量*嚴重低估了蛋白質的數量。這一抉擇也並非隨機——它是受調控的。細胞用一些特殊蛋白,根據細胞類型、發育階段或抵達細胞的信號,把剪接體偏向某一方。例如,同一個抗體基因,可以這樣剪接以把抗體錨定在免疫細胞表面,又那樣剪接以放出一個游離、被分泌到血液中的版本:同一個基因,兩種職能,就在剪接這一步決定。

為什麼細菌跳過這一切

一個誠實的對照把整篇串起來。這條精細的編輯流水線基本上是真核生物的事。細菌沒有細胞核,因此沒有一堵需要把信息擺渡過去的牆——它的核糖體可以一邊轉錄還在進行,就一邊抓住 RNA 開始造蛋白質,兩個過程並排發生。細菌的基因通常也沒有內含子,所以幾乎沒什麼可剪的。沒有核外運這一步,幾乎沒有剪接:細菌的草稿在生成的那一刻就已經接近可用了。

所以你剛學到的這套編輯並不是放之四海皆準的日常雜務;它是身為真核生物所付出的代價——也是所擁有的力量——的一部分。基因組周圍的那堵牆製造了一個遞送難題,而解決它(加帽、加尾、外運)順帶成了一個編輯、調控與多樣化(剪接、可變剪接)的機會。這一切的成品,是一條乾淨的、加了帽、加了尾、剪接好的信使 RNA,獲准外運、隨時可讀。讀它——把它那些三字母的詞變成一串氨基酸——就是翻譯,是中心法則的後半程,也是下一級的主題。