擾動並觀察:如何讀出一個基因的職責
在本級階梯前面的幾篇裡,你學會了在指定位點*改寫* DNA——CRISPR-Cas9 如何在一條嚮導 RNA 指示的地方切割,以及隨後細胞的修復要麼留下疤痕、要麼留下一處預定的編輯。這份能力回答了一個更古老、更深刻的問題:不是如何*改變*一個基因,而是如何弄清一個基因*管什麼*。基因組是一份沒有標籤的零件清單。讀序列能告訴你某基因存在、大致多長,但一串 A、T、G、C 並不會自報職責——基因型與表型之間的關係,正是我們要去發現的東西。
整套策略可以濃縮成兩個字:擾動與觀察。你拿一個運轉正常的細胞或生物體,只擾亂其中一個基因——把它關掉、調低、或在某些實驗裡把它開大——然後看會有什麼改變。如果弄壞基因 X 使眼睛失去顏色、使細胞無法分裂、或使胚胎在第三天夭折,你就當場抓住了基因 X 在做某件眼睛、分裂或胚胎所需要的事。這是用破壞來做的逆向工程:從一台正常運轉的機器裡拔出一根線,看哪盞燈滅了,你就明白了那根線是幹什麼的。你的破壞越乾淨、越專一,結論就越可信。
敲除與敲入:刪除與替換整個基因
[[gene-knockout-knockin|基因敲除]]永久廢除一個基因的功能,而你前面學過的編輯技術讓這幾乎變得輕而易舉。用一條嚮導 RNA 把 Cas9 瞄準該基因,讓它切斷雙鏈,然後依靠細胞那種迅速而粗糙的修復——把斷端重新黏起、過程中往往丟掉或加上幾個鹼基的末端連接途徑。錯位幾個鹼基便使閱讀框移位,於是下游每一個密碼子都被讀錯,蛋白成了一堆亂碼。基因在物理上依然在那裡,卻再也造不出有功能的產物——功能性死亡。在 CRISPR 之前,這需要在小鼠幹細胞裡做幾個月費力的靶向;如今一條嚮導 RNA 幾天就能辦到。
它的鏡像是敲入:不是毀掉一個基因,而是把一段選定的 DNA 嵌進一個精確的位置。這用到細胞那種謹慎、以模板為導引的修復——就是你前面學過的同源導向途徑——你提供一段兩側帶有與切口匹配序列的供體 DNA,細胞在癒合時便把你的插入片段抄進基因組。敲入能把一個致病突變改回正常、把一個人類基因換進小鼠,或者——對弄清功能最有用——把一個發光標籤融到一個基因上,好讓你看清它的蛋白何時何地出現。編輯那幾篇裡的一條誠實告誡在此依然適用:它強大,卻並非毫無瑕疵。Cas9 可能在基因組別處的相似位點切割——即脫靶效應——所以嚴謹的實驗會確認得到了預期的編輯,並核查沒有誤傷別處。
只在一處關、只在一時關:條件性等位基因
全身敲除有個殘酷的局限。許多基因是必需的——從受精起就在每個細胞裡把一個敲掉,胚胎乾脆就死了,而一個死掉的胚胎幾乎不能告訴你這個基因在比如說成年大腦裡管什麼。解決辦法是*條件性*敲除:造一個動物,它的這個基因在各處都完好無損,唯獨在你選定的地點或時間被關掉。經典的招數是在目標基因兩側各放一段短的標籤序列(叫 loxP 位點),它們像一對書籤。一種剪刀酶——Cre——能識別這些書籤,把它們之間的一切剪掉——於是只在含有 Cre 的細胞裡刪除該基因。
門道在於控制 Cre 在哪裡出現。把 Cre 基因放在一個只在肝細胞裡啟動的啟動子之下,基因就只在肝臟、別處不會被刪除——這是組織特異性敲除。把 Cre 放在一個只有當你給動物餵一種小藥物時才打開的開關之下,基因就一直完好無損,直到你決定撥動它的那一天——這是時間可控的敲除。兩者結合,你就能提出一個極其銳利的問題:這個基因在*這個*組織裡、從*這個*時刻起,究竟管什麼,而動物其餘部分則作為未被觸碰的對照。生物學家正是這樣去研究那些一旦從一開始就在各處去除便會致命的基因。
gene with two bookmarks: --[loxP]== target gene ==[loxP]-- no Cre present --> gene stays intact, normal function Cre present (liver, --[loxP]-- (everything between or after drug given) --> ^cut the bookmarks deleted) result: gene OFF only in cells / at times where Cre switched on
把基因調低:RNAi 與 CRISPR 敲低
有時你並不想讓一個基因消失——你想把它*調低*,可逆地、還根本不碰 DNA。做這件事的第一種工具,來自你早先在 RNA 階梯上遇到的細胞自帶機械。給細胞餵一條匹配你基因訊息的短雙鏈 RNA,細胞的 Dicer-RISC 裝置便會在序列吻合處把那條訊息絞碎——壓低蛋白,卻不改動基因組裡的任何一個鹼基。當作一種刻意的研究方法這樣使用時,這就是[[molbio-rna-interference|作為敲低手段的 RNA 干擾]]:便宜、快速、可逆、可調,但天生是部分性的——通常還會剩下一些訊息,而且偶爾也可能沉默掉無意中相似的訊息。
CRISPR 提供了第二種、更巧妙的調暗基因而不切它的辦法。取一個被刻意*鈍化*的 Cas9——它切 DNA 的顎被廢掉,於是它仍會按嚮導 RNA 所指認的位點歸位,卻再也無法造成斷裂。把這個失活的 Cas9 停在一個基因的啟動子上,它就在物理上擋住轉錄機械啟動,好比給一輛停著的車上了輪鎖:基因被讀取的次數大減,而它的 DNA 毫髮無傷。這就是[[crispr-interference-activation|CRISPR 干擾]],即 CRISPRi。改把同一個失活的 Cas9 融到一個激活輔助因子上,邏輯就翻轉——招募機械去*更使勁地*讀取這個基因(CRISPR 激活,CRISPRa)。於是同一副可複用的底盤,只靠更換嚮導 RNA,就能給出敲低、過表達,或者——配上完整的 Cas9——一次敲除。
讀出結果,並一次檢驗每個基因
擾動一個基因只是實驗的一半;另一半是*讀出有什麼改變*——這就是表型分析。有時表型一眼可見:一朵花變白、一條線蟲不再動、一個菌落長不起來。但常常你需要一個內建的讀數盤。[[reporter-gene|報告基因]]就是這個訣竅:你把一個易於觀察的基因——會發綠光、或把培養皿染藍的那種——融到你關心的基因的控制區上,於是每當你的基因本該開啟時,報告基因便同步亮起。這樣一個看不見的事件(這個基因此刻在這個細胞裡活躍嗎?)就變成一種你能拍照、能測量的亮度。報告基因把「基因開著嗎?」這個抽象問題變成了一個數字。
現在把整個想法放大。與其擾動一個基因、觀察一個細胞,不如設想:你能否把基因組裡的每個基因都弄壞——各在一個不同的細胞裡——並在一次實驗中找出,一個細胞離不開哪些基因,或一個腫瘤要繼續生長需要哪些基因?這就是[[molbio-crispr-screen|全基因組功能喪失篩選]],是現代生物學最強大的想法之一。你建一個龐大的嚮導 RNA 文庫——數以萬計,每個基因配一條或多條——把它送進一大池細胞,使每個細胞只攝入一條嚮導、只敲除一個基因。這一池細胞就成了一個活生生的問題,兩萬個答案同時並行運行。
- 建文庫:合成數以萬計的嚮導 RNA,每個基因配一條或多條,裝進遞送載體裡。
- 以低劑量感染一大池細胞,使平均每個細胞恰好得到一條嚮導、因而敲除一個基因——每個細胞裡是不同的基因。
- 施加選擇:讓這池細胞生長,或讓它經受一種藥物或脅迫,於是那些缺失基因要緊的細胞會繁盛或滅亡。
- 靠定序讀出:每條嚮導本身就是一個條碼,於是統計哪些嚮導變稀少、哪些變常見,便精確告訴你哪些基因是需要的、哪些是有害的。
讀出是其中精妙的部分,而它把定序階梯裡學的一切都用上了。每條嚮導 RNA 兼作一個獨一無二的條碼,於是你根本不必一個一個地盯著細胞。如果在你選定的壓力下敲除基因 Y 是致命的,攜帶那條嚮導的細胞便死去,它的條碼從池中消失;如果敲除基因 Z 幫助細胞在某種藥物下存活,它的條碼便增多。把整池細胞在前後各測一次序,統計每個條碼的豐度如何變化,要緊的基因便從噪聲中浮現出來。這樣的篩選已繪出每一種癌細胞類型依賴哪些基因——給獵藥者遞上一份靶點清單——並把幾十年裡一個基因一個基因做的慢工,化為一次合併的實驗。序列,就這樣在全基因組的尺度上變成了功能。