讀取與複製 DNA：PCR、凝膠電泳與定序

從看見細胞，到讀取牠們的密碼

本級前面的幾篇給了你「眼睛」。顯微鏡、螢光標記，以及把細胞養在培養皿裡的能力，讓我們得以*觀看*生命——但光看，能走的路是有限的。兩個細胞在最好的顯微鏡下也可能看起來一模一樣，卻攜帶著完全不同的 DNA、運行著不同的基因，或製造著數量不同的同一種蛋白質。要回答「是*哪個*基因」「序列*是什麼*」「蛋白質*有多少*」這類問題，你就得停下觀看，轉而去讀取分子本身。正是這一轉變——從看見到讀取——築起了現代分子生物學，而牠所依靠的技術，數量少得令人意外。

本篇四件工具中有三件，都建立在你早在基因組各級就見過的一個想法上：鹼基配對。因為 A 總是與 T 配對、G 總是與 C 配對，一條單鏈 DNA 就攜帶了足以找到、複製或讀出牠夥伴的全部資訊。複製 DNA（PCR）、讀取 DNA（定序），乃至下一篇裡基因編輯器所用的那個鹼基配對「地址標籤」，靠的都是同一條規則。第四件工具——蛋白質印漬——則橫跨一步，轉而追問蛋白質。牠們合在一起，讓我們得以複製、分選、讀取與偵測——這正是分子手藝的四個動詞。

PCR：一台分子影印機

第一個難題是赤裸裸的「稀少」。一滴血、一根髮根、從你臉頰上刮下的一點黏膜——每一份裡，任何一段特定 DNA 的含量都微乎其微，少到根本無法讀取或偵測。PCR，即聚合酶連鎖反應，正是用反覆複製某一選定區段的辦法來化解這一點：一個起始分子，最終被複製成上億個。可以把牠想成一台影印機，牠不影印整本書，只影印你指給牠看的那一段。PCR是讓本篇幾乎其餘一切都得以成立的技術，因為在分選或讀取 DNA 之前，你通常得先有*足量*的 DNA。

妙就妙在這裡：PCR 其實就是把 DNA 複製從細胞裡搬出來、放進試管裡跑一遍。回想複製那一級：複製需要把兩條鏈拉開、用短引子標出起點，再由 DNA 聚合酶去延長牠們。而 PCR 僅憑溫度變化就把這三件事全做了。加熱到接近沸騰，把雙螺旋撬成兩條單鏈。降溫，讓兩段量身設計的短引子——你的目標區段兩端各一段——精確地黏到你希望複製開始和結束的位置。隨後一個升溫步驟，讓聚合酶在兩段引子之間填出嶄新的鏈。有一個細節讓牠真正變得實用：普通聚合酶會被接近沸騰的那一步破壞掉，所以 PCR 用的是一種耐熱聚合酶，借自生活在溫泉裡的微生物。

變性：把樣品加熱到接近沸騰，使每條雙螺旋裂成兩條單鏈。
退火：降溫，使兩段短引子黏附到你目標序列的精確兩端。
延伸：略微升溫，使耐熱聚合酶從每段引子開始合成一條新鏈。
循環：每一輪使拷貝數翻倍，所以約 30 個循環就能把一個分子變成上億個。

凝膠電泳：按大小分選

現在你有了一管 DNA——可你怎麼知道這次 PCR 真的複製了對的東西，而不是某些更短的垃圾？辦法是把這些片段按大小分選。凝膠電泳會澆出一塊布滿微孔、果凍一般的凝膠板，把你的 DNA 裝進一端的小加樣孔裡，再在兩端加上電流。在這裡，DNA 的化學性質替你幹了活：牠的骨架帶著均勻的負電，所以每個片段都被拖向正極。小片段在網眼裡蠕動得快、跑得遠；大片段則被卡住、落在後面。凝膠電泳把一份看不見的混合物，變成一道道帶狀的「階梯」，每一條帶都是一堆大小完全相同的片段堆在一起。

  wells (load here)               negative electrode (-)
   |   |   |   |
  [===][===][===][===]   <- DNA starts here, runs DOWN
   :    =    :    =          big fragments: slow, near top
   =    :    =    :
   :    =    :              small fragments: fast, near bottom
   =         =
   v   v   v   v                positive electrode (+)
  lane1 marker  sampleA sampleB   (compare to known sizes)

裝在加樣孔裡的 DNA 朝正極遷移；小片段跑得最遠。把樣品泳道和一條已知大小的「標誌物」泳道對照，就能讀出每條帶的大小。

對凝膠能告訴你什麼、不能告訴你什麼，要誠實。在樣品旁邊跑一條已知大小的標誌物泳道，你就能大致讀出每條帶有多大——所以凝膠能確認*存在一個大小正確的分子*。但僅此而已。凝膠無法告訴你這條帶真正的序列、牠是哪個基因、牠有什麼功能；兩個毫不相干、卻長度相同的片段，會落在完全相同的位置。凝膠電泳是一件分離與定大小的工具，而非鑑定的工具——這恰恰是為什麼牠常常充當*第一步*，把樣品送進定序或蛋白質印漬，真正的鑑定在那裡才發生。

定序：讀出字母

複製並定好大小，仍然沒有回答那個最根本的問題：牠到底*在說什麼*？DNA 把意義儲存在牠四個字母——A、T、G、C——的精確排列順序裡，而一攤 DNA，無論多麼充足，在你讀出這個順序之前都什麼也告訴不了你。DNA 定序就是逐個字母把牠讀出來的技術，牠把一個物理分子變成可以儲存、檢索，並與地球上任何其他基因組相比對的文本。正是這一步，把生物學轉化成了資訊。

大多數現代定序，又一次倚靠複製——只不過是被放慢了來觀看的複製。機器在被讀取的 DNA 對面合成一條新鏈，並安排每一個字母在被加上去的同時「自報家門」：在一種被廣泛採用的方法裡，每個被摻入的鹼基都會閃出一小束光，光的顏色說明牠是四個字母中的哪一個。一台相機按順序記錄這些顏色，於是把序列拼寫了出來。讓DNA 定序變得廉價的訣竅，是不止對一個分子、而是同時對上百萬個分子並行地這樣做，於是一個三十億字母的人類基因組如今一兩天就能讀完——而這件事，第一個人類基因組計畫花了十多年、耗資數十億美元。

然而，序列並不等於理解。定序告訴你這份食譜*怎麼寫*——字母的順序——但牠本身並不告訴你在某個特定細胞裡哪些基因被開啟了、細胞究竟如何使用牠們，或者某一段陌生序列有什麼作用。知道存在一個突變，本身並不能告訴你牠是否致病；那仍然需要做實驗，就是你兩篇前在培養皿裡做的那種實驗，而且常常要在模式生物裡做。而且這些讀取本身也會帶有偶發的錯誤，所以任何重要的發現，都要靠把同一區域反覆讀取許多遍來確認。定序揭示了文本；而文本的含義，是另一個更難的問題。

蛋白質印漬：抓住一種蛋白質

DNA 告訴你食譜；蛋白質則是真正被烹出來的那道菜。一個細胞可以攜帶某個基因，卻一點都不製造牠的蛋白質，也可以傾倒出極大量的蛋白質——而真正幹活的，只有蛋白質。蛋白質印漬回答關於某一選定蛋白質的兩個樸素問題：牠在不在，以及大約有多少？牠正是從凝膠停下的地方接著開始：先用凝膠電泳把細胞的蛋白質按大小分開（蛋白質和 DNA 一樣，可以被誘導著按大小在凝膠裡行進），再把牠們轉移——*印*——到一張薄膜上，薄膜把牠們釘在原位以供探測。

接下來是巧妙之處，你在螢光那一篇裡已經見過：用一種抗體作為量身定形的探針。一種針對你目標蛋白質製備的抗體被淋在薄膜上，牠只黏住那一種蛋白質，無視其餘成千上萬種。隨後第二種帶標記的抗體扣到第一種上，產生可見的訊號——一條深色的帶，或一團亮光——恰好落在目標所在之處。這條帶在凝膠上的*位置*揭示了蛋白質的大小；牠的*深淺*則大致反映出含量多少。這和免疫染色裡「抗體即探針」的邏輯完全相同，只不過結果是讀成薄膜上的一條帶，而非細胞內的一團亮光。

四個動詞，一套流程

這些工具組合起來最為耀眼，一件接一件地往下傳。典型的一天可能是這樣：從樣品裡提取一點點 DNA，用 PCR 把目標基因*複製*到足量；跑一塊凝膠把產物*分選*出來、確認大小正確；把那條帶送去*讀取*牠的序列；如果你在意這個基因是否真的被造成了蛋白質，就再跑一次蛋白質印漬去*偵測*並大致測量那種蛋白質。複製、分選、讀取、偵測——四個動詞，環環相扣，串成分子實驗室日常的工作流程。

請留意貫穿這一切的那條共同主線。PCR 複製 DNA，定序讀取 DNA，而最後一篇裡等著的那台基因編輯器也把自己瞄準 DNA——這三件事之所以行得通，全都因為 A 與 T、G 與 C 配對，正是這同一條把雙螺旋維繫在一起的鹼基配對規則。我們如今已經學會了*看見*細胞、*培養*並*分選*牠們，以及*讀取和複製*牠們的密碼。只剩下最後一個動詞，也是最大膽的一個：*改寫*牠。這正是下一篇為整條階梯收尾之處——CRISPR，那件把「讀取密碼」變成「編輯密碼」的工具。