從看見細胞,到讀取牠們的密碼
本級前面的幾篇給了你「眼睛」。顯微鏡、螢光標記,以及把細胞養在培養皿裡的能力,讓我們得以*觀看*生命——但光看,能走的路是有限的。兩個細胞在最好的顯微鏡下也可能看起來一模一樣,卻攜帶著完全不同的 DNA、運行著不同的基因,或製造著數量不同的同一種蛋白質。要回答「是*哪個*基因」「序列*是什麼*」「蛋白質*有多少*」這類問題,你就得停下觀看,轉而去讀取分子本身。正是這一轉變——從看見到讀取——築起了現代分子生物學,而牠所依靠的技術,數量少得令人意外。
本篇四件工具中有三件,都建立在你早在基因組各級就見過的一個想法上:鹼基配對。因為 A 總是與 T 配對、G 總是與 C 配對,一條單鏈 DNA 就攜帶了足以找到、複製或讀出牠夥伴的全部資訊。複製 DNA(PCR)、讀取 DNA(定序),乃至下一篇裡基因編輯器所用的那個鹼基配對「地址標籤」,靠的都是同一條規則。第四件工具——蛋白質印漬——則橫跨一步,轉而追問蛋白質。牠們合在一起,讓我們得以複製、分選、讀取與偵測——這正是分子手藝的四個動詞。
PCR:一台分子影印機
第一個難題是赤裸裸的「稀少」。一滴血、一根髮根、從你臉頰上刮下的一點黏膜——每一份裡,任何一段特定 DNA 的含量都微乎其微,少到根本無法讀取或偵測。PCR,即聚合酶連鎖反應,正是用反覆複製某一選定區段的辦法來化解這一點:一個起始分子,最終被複製成上億個。可以把牠想成一台影印機,牠不影印整本書,只影印你指給牠看的那一段。PCR是讓本篇幾乎其餘一切都得以成立的技術,因為在分選或讀取 DNA 之前,你通常得先有*足量*的 DNA。
妙就妙在這裡:PCR 其實就是把 DNA 複製從細胞裡搬出來、放進試管裡跑一遍。回想複製那一級:複製需要把兩條鏈拉開、用短引子標出起點,再由 DNA 聚合酶去延長牠們。而 PCR 僅憑溫度變化就把這三件事全做了。加熱到接近沸騰,把雙螺旋撬成兩條單鏈。降溫,讓兩段量身設計的短引子——你的目標區段兩端各一段——精確地黏到你希望複製開始和結束的位置。隨後一個升溫步驟,讓聚合酶在兩段引子之間填出嶄新的鏈。有一個細節讓牠真正變得實用:普通聚合酶會被接近沸騰的那一步破壞掉,所以 PCR 用的是一種耐熱聚合酶,借自生活在溫泉裡的微生物。
- 變性:把樣品加熱到接近沸騰,使每條雙螺旋裂成兩條單鏈。
- 退火:降溫,使兩段短引子黏附到你目標序列的精確兩端。
- 延伸:略微升溫,使耐熱聚合酶從每段引子開始合成一條新鏈。
- 循環:每一輪使拷貝數翻倍,所以約 30 個循環就能把一個分子變成上億個。
凝膠電泳:按大小分選
現在你有了一管 DNA——可你怎麼知道這次 PCR 真的複製了對的東西,而不是某些更短的垃圾?辦法是把這些片段按大小分選。凝膠電泳會澆出一塊布滿微孔、果凍一般的凝膠板,把你的 DNA 裝進一端的小加樣孔裡,再在兩端加上電流。在這裡,DNA 的化學性質替你幹了活:牠的骨架帶著均勻的負電,所以每個片段都被拖向正極。小片段在網眼裡蠕動得快、跑得遠;大片段則被卡住、落在後面。凝膠電泳把一份看不見的混合物,變成一道道帶狀的「階梯」,每一條帶都是一堆大小完全相同的片段堆在一起。
wells (load here) negative electrode (-) | | | | [===][===][===][===] <- DNA starts here, runs DOWN : = : = big fragments: slow, near top = : = : : = : small fragments: fast, near bottom = = v v v v positive electrode (+) lane1 marker sampleA sampleB (compare to known sizes)
對凝膠能告訴你什麼、不能告訴你什麼,要誠實。在樣品旁邊跑一條已知大小的標誌物泳道,你就能大致讀出每條帶有多大——所以凝膠能確認*存在一個大小正確的分子*。但僅此而已。凝膠無法告訴你這條帶真正的序列、牠是哪個基因、牠有什麼功能;兩個毫不相干、卻長度相同的片段,會落在完全相同的位置。凝膠電泳是一件分離與定大小的工具,而非鑑定的工具——這恰恰是為什麼牠常常充當*第一步*,把樣品送進定序或蛋白質印漬,真正的鑑定在那裡才發生。
定序:讀出字母
複製並定好大小,仍然沒有回答那個最根本的問題:牠到底*在說什麼*?DNA 把意義儲存在牠四個字母——A、T、G、C——的精確排列順序裡,而一攤 DNA,無論多麼充足,在你讀出這個順序之前都什麼也告訴不了你。DNA 定序就是逐個字母把牠讀出來的技術,牠把一個物理分子變成可以儲存、檢索,並與地球上任何其他基因組相比對的文本。正是這一步,把生物學轉化成了資訊。
大多數現代定序,又一次倚靠複製——只不過是被放慢了來觀看的複製。機器在被讀取的 DNA 對面合成一條新鏈,並安排每一個字母在被加上去的同時「自報家門」:在一種被廣泛採用的方法裡,每個被摻入的鹼基都會閃出一小束光,光的顏色說明牠是四個字母中的哪一個。一台相機按順序記錄這些顏色,於是把序列拼寫了出來。讓DNA 定序變得廉價的訣竅,是不止對一個分子、而是同時對上百萬個分子並行地這樣做,於是一個三十億字母的人類基因組如今一兩天就能讀完——而這件事,第一個人類基因組計畫花了十多年、耗資數十億美元。
然而,序列並不等於理解。定序告訴你這份食譜*怎麼寫*——字母的順序——但牠本身並不告訴你在某個特定細胞裡哪些基因被開啟了、細胞究竟如何使用牠們,或者某一段陌生序列有什麼作用。知道存在一個突變,本身並不能告訴你牠是否致病;那仍然需要做實驗,就是你兩篇前在培養皿裡做的那種實驗,而且常常要在模式生物裡做。而且這些讀取本身也會帶有偶發的錯誤,所以任何重要的發現,都要靠把同一區域反覆讀取許多遍來確認。定序揭示了文本;而文本的含義,是另一個更難的問題。
蛋白質印漬:抓住一種蛋白質
DNA 告訴你食譜;蛋白質則是真正被烹出來的那道菜。一個細胞可以攜帶某個基因,卻一點都不製造牠的蛋白質,也可以傾倒出極大量的蛋白質——而真正幹活的,只有蛋白質。蛋白質印漬回答關於某一選定蛋白質的兩個樸素問題:牠在不在,以及大約有多少?牠正是從凝膠停下的地方接著開始:先用凝膠電泳把細胞的蛋白質按大小分開(蛋白質和 DNA 一樣,可以被誘導著按大小在凝膠裡行進),再把牠們轉移——*印*——到一張薄膜上,薄膜把牠們釘在原位以供探測。
接下來是巧妙之處,你在螢光那一篇裡已經見過:用一種抗體作為量身定形的探針。一種針對你目標蛋白質製備的抗體被淋在薄膜上,牠只黏住那一種蛋白質,無視其餘成千上萬種。隨後第二種帶標記的抗體扣到第一種上,產生可見的訊號——一條深色的帶,或一團亮光——恰好落在目標所在之處。這條帶在凝膠上的*位置*揭示了蛋白質的大小;牠的*深淺*則大致反映出含量多少。這和免疫染色裡「抗體即探針」的邏輯完全相同,只不過結果是讀成薄膜上的一條帶,而非細胞內的一團亮光。
四個動詞,一套流程
這些工具組合起來最為耀眼,一件接一件地往下傳。典型的一天可能是這樣:從樣品裡提取一點點 DNA,用 PCR 把目標基因*複製*到足量;跑一塊凝膠把產物*分選*出來、確認大小正確;把那條帶送去*讀取*牠的序列;如果你在意這個基因是否真的被造成了蛋白質,就再跑一次蛋白質印漬去*偵測*並大致測量那種蛋白質。複製、分選、讀取、偵測——四個動詞,環環相扣,串成分子實驗室日常的工作流程。
請留意貫穿這一切的那條共同主線。PCR 複製 DNA,定序讀取 DNA,而最後一篇裡等著的那台基因編輯器也把自己瞄準 DNA——這三件事之所以行得通,全都因為 A 與 T、G 與 C 配對,正是這同一條把雙螺旋維繫在一起的鹼基配對規則。我們如今已經學會了*看見*細胞、*培養*並*分選*牠們,以及*讀取和複製*牠們的密碼。只剩下最後一個動詞,也是最大膽的一個:*改寫*牠。這正是下一篇為整條階梯收尾之處——CRISPR,那件把「讀取密碼」變成「編輯密碼」的工具。