從一個核苷酸到兩米長的絲線
你在化學那一級已經見過它的構件:核苷酸——一個由糖、磷酸基團和一個含氮鹼基組成的三部分小單元。單獨一個核苷酸毫不起眼。真正的魔法始於細胞把數百萬個核苷酸串成一條長鏈。這條鏈就是 DNA 的一條單鏈——在人體細胞裡,如果把它全部解開首尾相接,長度約為兩米。這就是整個基因組,是你細胞完整的說明書,被塞進一個小到根本看不見的細胞核裡。
這些核苷酸是怎麼彼此牽手的?每個糖都與下一個核苷酸的磷酸相連,形成一條糖—磷酸—糖—磷酸不斷重複的長鏈。這就是糖磷酸骨架——單鏈的結構脊樑。關鍵在於,骨架本身從不變化:它從頭到尾都是同一條單調的軌道。信息根本不在骨架裡。信息完全藏在從骨架側向伸出的鹼基中,每個核苷酸帶一個鹼基,就像串在線上的一顆顆珠子。
四個字母,兩種配對
鹼基只有四種,我們用它們的首字母來稱呼:A(腺嘌呤)、T(胸腺嘧啶)、G(鳥嘌呤)和 C(胞嘧啶)。這就是基因組的全部字母表——四個,不多不少。它顯得幾乎太少了。但要記住,這個順序可以延伸數億個字母,因此可能的訊息數量實際上是無窮的,正如 26 個字母足以拼出有史以來所有的書。
現在來看整個分子生物學中最深刻的規則:四個字母並不是可以隨意互換的搭檔。A 總是與 T 配對,G 總是與 C 配對。這就是互補鹼基配對,它並非某人選定的約定——而是由化學強制決定的。A 與 T 之間靠兩條弱氫鍵結合;G 與 C 之間靠三條。它們的形狀和成鍵位點如同鑰匙插進鎖孔般吻合。A 根本無法與 G 或 C 緊密配對,T 也無法與 G 配對。配對之所以挑剔,是因為這些分子確實只能以一種方式相互契合。
strand 1: A T G G C A T
| | | | | | | <- base pairs
strand 2: T A C C G T A
A=T : 2 hydrogen bonds
G(C) : 3 hydrogen bonds扭曲的梯子——以及它為何如此扭曲
把這兩個想法合在一起。兩條骨架並排延伸;鹼基向內伸出,在中間的空隙處彼此配對。結果就是一架梯子:兩條糖磷酸骨架是兩側的扶手,每一對鹼基是一級橫檔。然後整架梯子輕柔地擰成螺旋。這條螺旋就是著名的雙螺旋——可以說是地球上最容易辨認的分子。這種扭轉並非裝飾;把怕水的鹼基藏到內側、遠離細胞內部的水環境,而讓親水的骨架朝外,對這個分子來說不過是最舒適、最穩定的安頓姿態。
還有一個結構事實,它遠比看上去重要:兩條鏈的走向相反。每條骨架都有內在的方向(化學家把它的兩端標為 5′ 端和 3′ 端),兩條鏈頭尾相錯地疊放——一條朝上,它的搭檔朝下。我們稱之為反向平行。可以想像一條公路的兩條車道,車流方向相反。這聽起來像吹毛求疵的細節,但在接下來的幾篇裡,正是這一個事實,會逼著細胞在複製 DNA 時做出一些真正巧妙的「體操動作」。
為什麼配對是複製生命的秘密
現在迎來讓整個結構令人嘆為觀止的回報。因為 A 永遠面對 T、G 永遠面對 C,兩條鏈不僅僅是搭檔——每一條都是重建另一條的完整配方。哪怕你只知道一條鏈讀作 …ATGGCAT…,你也能在黑暗中、不需要任何額外信息,寫出它的搭檔:…TACCGTA…。只留一邊,什麼都不會丟失。
沃森和克里克在弄對結構的那一刻就明白了這一點,他們寫下了那句名言:這種配對「立即暗示了一種可能的複製機制」。要從一個 DNA 分子造出兩個,細胞只需把螺旋從中間「拉開拉鏈」,打斷鹼基之間那些弱氫鍵,同時讓骨架保持完整。隨後每條舊鏈都充當模板:游離的核苷酸漂移進來,按照 A-T、G-C 規則配對,每一半都被重建成一條完整的雙螺旋。結果是兩份完全相同的拷貝,每一份都保留一條原來的舊鏈和一條新造的鏈。這種「一舊一新」的方案叫做半保留複製,我們將在下一篇裡一步步追蹤執行它的那套機器。
沃森、克里克、富蘭克林——誠實地歸功
雙螺旋於 1953 年由詹姆斯·沃森和法蘭西斯·克里克發表,他們的名字是大多數人記住的那兩個。但這一結構並非憑空降臨到他們頭上。它的決定性證據來自 DNA 的 X 射線繞射圖像,由倫敦國王學院的羅莎琳德·富蘭克林及其學生雷蒙德·戈斯林拍攝。富蘭克林是一位一絲不苟的實驗科學家;她那張著名的「51 號照片」顯示出一種 X 形圖樣,幾乎是在高喊「螺旋」,而她精確的測量則鎖定了骨架在外的排布方式與螺旋的尺寸。
令人不安的事實是:沃森和克里克在富蘭克林本人並不知情、也未同意的情況下,看到了 51 號照片以及她未發表數據的摘要——而這對他們的模型至關重要。1962 年的諾貝爾獎授予了沃森、克里克和莫里斯·威爾金斯;富蘭克林已於 1958 年因卵巢癌去世,年僅 37 歲,而諾獎不追授給已故者。她是否本會分享這一榮譽,是歷史無法回答的問題,但今天人們普遍認同:她的貢獻是奠基性的,而在當時被嚴重低估了。誠實地講述這段故事,本身就是理解這門科學的一部分。
基因究竟是什麼——以及一次快速的現實校準
如果說基因組是整本說明書,那麼一個基因大致就是其中一段有意義的段落——一段拼寫出某個產物(通常是一種蛋白質)指令的鹼基序列。你那兩米長的 DNA 大約含有兩萬個編碼蛋白質的基因。但這裡有一個讓大多數人意外的現實校準:這些基因只佔總量很小的一部分。人類 DNA 的大部分根本不編碼蛋白質,而要釐清其餘部分究竟在做什麼——其中有些起調控作用,有些至今仍知之甚少——這仍是一門活躍的科學,而非已經蓋棺定論的故事。
在繼續之前,再做兩處誠實的糾正。第一,DNA 並不「想要」任何東西,基因也不是一個決定你命運的微型小人;它只是一段惰性的序列,在被細胞機器讀取之前什麼都不做。第二,基因並非命運——哪些基因被開啟、何時開啟,在很大程度上取決於細胞類型和環境,這是我們將在基因調控那一級重新探討的主題。眼下,請記住這幅核心圖景:一段四字母序列,配對成一條反向平行的雙螺旋,而正是它的互補性,使它既能被讀取、又能被忠實地複製。