CRISPR 登場時面對的難題
上一篇導覽介紹了可程式化基因組編輯的夢想——以及最早追逐這個夢想的兩台精巧機器。鋅指核酸酶和 TALEN 都能用,也都證明了那個核心思想:把一個能抓住某段選定 DNA 序列的蛋白質,拴在一把能切割的核酸酶上,你就能在恰好一個位點處切斷螺旋。但兩者都有同一個令人精疲力竭的毛病。要把它們瞄準一個新靶點,你得重新設計、重新搭建那個*蛋白質*——重新改造一串手指或重複單元,讓它識別一段新的鹼基,這活兒要花上數週瑣碎的工夫,還常常失敗。瞄準是可能的,但每一次都是一項蛋白質工程。
這正是 CRISPR 擊碎的瓶頸。它的瞄準單元根本不是蛋白質,而是一小段 RNA——你只需敲入一段新序列、訂購對應的 RNA,就能指定一個新靶點,這是一個下午的活兒,而非一個月。要弄清這一處替換何以改變了一切,我們得回到 CRISPR 真正的來處:它從來不是作為編輯工具被發明出來的,而是作為一套免疫系統被發現的——它在細菌體內默默運轉了數十億年,遠在任何人意識到它能被改造成什麼之前。
一個會記住病毒的細菌
細菌長期遭受一類叫噬菌體的病毒的猛攻,這些病毒注入自己的 DNA 來劫持細胞。在漫長的演化中,一些細菌演化出了一種了不起的防禦:一套*適應性免疫系統*,能記住過去的攻擊者,並在它們再來時認出它們。這份記憶儲存在基因組本身裡,存放在一段名叫 CRISPR 的序列中——成簇規律間隔短回文重複序列。這一長串拗口名字背後是一幅簡單的圖景:一連串相同的短重複序列,被一個個獨特的間隔序列隔開。每一段間隔序列,都是從細胞(或其祖先)所倖存下來的某個病毒那裡截獲的一小段 DNA——一張存檔以備下次之需的分子大頭照。
當那個病毒再次來襲,細胞便把對應的間隔序列轉錄成一小段 RNA,交給一個負責切割的蛋白質——在我們關心的這套系統裡,就是 Cas9 核酸酶。接下來便是整個訣竅的核心,它應當讓你覺得似曾相識,因為這一級階梯上此前的一切都指向它。那段 RNA 攜帶著所記住病毒的*序列*,而一條單鏈 RNA 識別一條匹配的 DNA,靠的正是核酸之間唯一的相認方式:鹼基配對,A 伸過去對 T、G 對 C。於是裝載了 RNA 的 Cas9 沿著入侵的 DNA 滑行,直到那段 RNA 找到它的互補對象,牢牢鎖住,Cas9 隨即下刀。病毒在一處細胞預先選定的序列上被摧毀。
Cas9 究竟如何找到並切開靶點
為把大自然的防禦變成實驗室工具,生物學家做了兩處簡化。第一,在天然系統裡,瞄準其實要用兩段小 RNA 協同完成;研究者把它們融合成了一個易於製造的分子,即單導向 RNA,簡稱導向 RNA。第二,他們只保留所需的部件:Cas9 蛋白和導向 RNA。這一對,就是編輯器的全部。導向 RNA 是地址標籤,攜帶著一段約 20 個鹼基、由你選定的序列;Cas9 則是剪刀,負責抓握與切割。換掉那 20 個鹼基,你便重新瞄準了整台機器,全程不需要任何蛋白質工程。
但單靠鹼基配對會引出一個實實在在的難題。基因組是三十億個鹼基的雙螺旋;倘若 Cas9 得把每一個位置都解開、再拿導向 RNA 去比對,它永遠也比對不完。解決的捷徑是一處叫 PAM 的小地標——前間隔序列鄰近基序——這是一小段序列(對常見的 Cas9 來說,就是 5'-NGG-3' 三個字母,意思是任意一個鹼基後面跟著兩個 G),它必須緊挨在靶點旁邊。Cas9 並不通讀整個基因組;它沿著 DNA 一路碰撞,只檢查有沒有 PAM,而 PAM 每隔幾百個鹼基就有一處。只有當它落在一處 PAM 上,才會把螺旋撬開,讓導向 RNA 去檢驗旁邊的鹼基是否匹配。沒有 PAM,就不切——哪怕導向 RNA 本可以完美配對。
PAM 還順帶解開了細菌自己面對的一道難題:它如何避免攻擊自己存檔的那份記憶?CRISPR 陣列裡儲存的間隔序列與病毒相匹配,那 Cas9 為何不去攻擊細胞自己的基因組?因為那段間隔序列旁邊*沒有* PAM,而真正的病毒才帶著 PAM。隔壁沒有 PAM,細胞就把它讀作「自己」,放它一馬。這是一道小巧而優雅的保險——也再一次提醒我們,整套系統早在我們借用它之前,就已被進化調校得能分清敵我。
切割,一步一步來
- 裝載。Cas9 包裹住導向 RNA,讓它那約 20 個鹼基的瞄準段像探針一樣伸到蛋白質前方。
- 掃描。複合物沿著雙螺旋一路碰撞,只在遇到 PAM(對常見 Cas9 而言即 5'-NGG-3' 三個字母)的地方才停下。
- 試探。在 PAM 處,Cas9 把兩條鏈撬開,讓導向 RNA 去和旁邊的 DNA 試著鹼基配對。
- 確認。若配對良好,RNA-DNA 的配對便牢牢拉合、把 Cas9 鎖定在原位;若配對很差,複合物便鬆手離開,繼續前行。
- 切割。Cas9 的兩個切割結構域各切一條鏈,在 PAM 內側幾個鹼基處留下一道整齊的雙鏈斷裂。
- 交棒。Cas9 的活兒在斷裂處就結束了;接手的是細胞自己的修復機器,而你得到什麼,完全取決於細胞怎樣把它補好。
guide RNA (20 nt, chosen by you)
| | | | | | | | | | | | | | | | | | | | PAM
5'-...A C G T A C C G G T A A C T G A T C C A G | N G G ...-3' <- target strand
3'-...T G C A T G G C C A T T G A C T A G G T C | N C C ...-5'
^ Cas9 cuts both strands ~3 bp inside the PAM
No NGG next door -> no cut, even with a perfect guide match.最後這一步值得停一停,因為初學者的腦中模型往往就在這裡出錯。Cas9 並不*改寫* DNA。它所做的全部,就是製造一道雙鏈斷裂——把螺旋的兩條車道整齊地切斷。此後發生的一切、真正的編輯,是細胞自己的修復反應,而它選擇哪條途徑,正是決定你結果的關鍵:那條迅速卻易出錯的途徑往往把幾個鹼基攪亂、把基因弄壞,而另一條較慢、由模板引導的途徑則能精確地改寫序列。下一篇導覽專門講這處岔路。眼下,請記住這個誠實的版本:CRISPR 是一把精準的*切割器*,而細胞才是*編輯者*。
它為何變革了整個領域——又在哪裡力有不逮
現在你能掂量出這一躍有多大了。用鋅指和 TALEN,換靶點意味著花數週搭建一個新蛋白質。用 CRISPR,換靶點意味著在電腦上選定一段新的 20 鹼基序列,再郵購對應的導向 RNA——這是一項幾乎瞬時、幾乎免費的改動,任何具備基本實驗技能的人都能做到。Cas9 蛋白始終不變;變的只是那段便宜、可隨意替換的 RNA。這一處轉變幾乎在一夜之間讓基因組編輯變得人人可及:那些從前絕無可能造出一個 TALEN 的實驗室,幾個月內就在編輯基因了。這是生物學有史以來最快、最廣的方法變革之一,也在關鍵演示之後不到十年便摘得了諾貝爾獎。
但在這件事上,誠實比炒作更要緊,因為 CRISPR 常被吹噓成一把完美無瑕、能對 DNA「查找—替換」的工具。它既不完美,也不是替換。它最大的可靠性隱憂是脫靶效應:一段在你預定位點完美配對的導向 RNA,也可能在基因組裡另一些僅差一兩個鹼基的位點上配得*幾乎*夠好,而 Cas9 同樣會在那裡下刀。一道落在錯誤基因裡的偏刀可能悄無聲息——也可能讓一個抑癌基因失靈,釀成傷害。更糟的是,即便在對的位點,結果也不完全由你掌控,因為正如我們所見,你並不能選擇修復方式:細胞才說了算,而它那條又快又糙的途徑,往往留下一小段未經預謀的鹼基亂碼。