那根必須變成機器的線
上一階裡,你看著核糖體讀取遺傳密碼、把胺基酸一顆顆縫成一條鏈。但從那台機器裡滑出來的,從任何能幹活的意義上說都還不是一個蛋白質——它是一根軟塌塌、鬆垮垮的線,一條毫無形狀的多肽,差不多就像一堆沒串起來的散珠那樣沒用。你在上一階學到的關於蛋白質功能的一切——活性位點的口袋、結合區域、那個允許別構的會呼吸的摺疊——全都先得仰仗這條鏈塌縮成某一個精確的三維形狀。本篇講的就是這場塌縮:在它誕生之後的幾秒到幾分鐘裡,一根線如何找到那唯一一個能讓它幹活的形狀。
這裡有件事應當讓你驚訝。一個不大的蛋白質,比如說 150 個殘基,可能的形狀多到無法想象——每一個肽鍵都能轉動,而這些選擇會層層相乘。如果這條鏈必須一個一個去試,哪怕每秒翻動十億個形狀,這場搜索也要把宇宙的年齡翻上許多倍才搜得完。然而真實的蛋白質在幾毫秒到幾分鐘內就摺好了。它們顯然不是在盲目地搜索。所以摺疊之謎其實是兩個問題:是什麼告訴這條鏈該奔向哪個形狀,又是什麼阻止它在半路上迷失?
安芬森:答案就寫在序列裡
第一個問題有一個乾淨而漂亮的答案,它來自一個經典實驗。上世紀六十年代,克里斯蒂安·安芬森取來一個小酶——核糖核酸酶,在試管裡把它徹底解開——加進藥劑打斷每一個弱鍵,甚至切斷了起穩定作用的二硫鍵,只留下一根變性的、毫無生氣的線。然後他輕輕地把那些藥劑洗去。這個蛋白質竟全憑自己重新摺疊,回到了一模一樣的活性形狀——試管裡沒有核糖體、沒有幫手、沒有任何指令,只有這條鏈本身。這個結論,如今叫做安芬森原理,就是:單憑胺基酸序列,就已經包含了確定摺疊結構所需的全部資訊。
為什麼序列裡會藏著答案?因為摺疊由你在化學那一階見過的同一批力推動,只是如今同時發力。最強的是疏水效應:這條鏈泡在水裡,於是那些油性的、厭水的側鏈爭相把自己埋進內部、躲開溶劑,而親水的那些則留在表面——而哪些殘基是油性的,完全由序列定死。隨著鏈變得緊湊,氫鍵咔嗒咔嗒地扣進你早已熟悉的規整圖案——α螺旋和β摺疊片——再由其餘一張弱非共價接觸之網把整個結構鎖得嚴絲合縫。簡而言之,摺疊後的形狀,就是這條序列所能落入的能量最低的排布,是一道自由能谷的谷底。
漏斗:搜索為何並非無望
於是序列選定了目的地——可這條鏈怎樣*抵達*那裡,又不必經歷那不可能完成的盲目搜索?現代圖景用一個鮮活的形象回答了第二個問題:摺疊漏斗。設想一片能量的地貌,地表上每一個點都是這條鏈的一種可能形狀,而它的高度就是那個形狀的能量。這片地貌不是一馬平川、只在某處藏著一個海底撈針般的孔;它的形狀像一個漏斗——邊緣寬闊而高聳,未摺疊的鏈在那裡於無數鬆軟的形狀之間遊蕩,地勢則穩穩地*向下、向內*傾斜,奔向底部那唯一的低點,也就是摺疊好的天然態。
漏斗化解了那個不可能搜索的悖論。一條鏈無需靠運氣找到谷底;它只需要*往下坡*滾,而幾乎任何使其能量降低的隨機晃動,都會把它往裡推一推。關鍵在於:並不存在唯一正確的路線——一百萬條鏈從一百萬個不同的鬆軟形狀出發,全都可以沿同一個漏斗的不同坡面滾落,到達同一個谷底。這正是摺疊之所以快的原因:能量地貌本身在引路,使每一步都偏向目標。半路上的一些小坑——鏈會停頓的半摺疊態——確實存在,有時也會拖慢進程,但整體的傾斜始終指向歸宿。
ENERGY
high |\ /| <- unfolded: many floppy shapes, high energy
| \ / |
| \ /\ / | <- partly folded; small dimples can trap briefly
| \/ \/ |
low | \__/ <- native fold: one low-energy bottom
(many paths down -> one destination)誠實的亂象:在擁擠的細胞裡摺疊
安芬森的試管乾淨、稀薄、又有耐心。細胞內部一樣也不沾。它擁擠得不可思議——被蛋白質和其他分子塞得密密匝匝,一條剛做好的鏈從冒頭的那一刻起就和鄰居們摩肩接踵。更糟的是,這條鏈是從核糖體裡緩緩出來的、一頭先出,於是它那些飢渴的疏水片段早早地裸露、晃蕩在外,而本該用來把它們包埋起來的其餘鏈段甚至還沒被造出來。在這般擁擠中,最大的危險並不是摺不起來——而是一條做了一半的鏈上裸露的黏性區域,抓住了*另一條*鏈的黏性區域,把許多條鏈黏成一坨無用、往往還有毒的團塊,稱為聚集體。
所以細胞絕不把摺疊交給運氣。它僱了一隊叫做分子伴侶的幫手蛋白質——而我們值得把它們到底做什麼說清楚,因為流行的圖景是錯的。一個伴侶*並不*替鏈去摺疊;它不把鏈按進它的形狀裡,也不攜帶任何關於那形狀應是什麼樣的指令。答案仍然握在序列手裡,分毫不差,正如安芬森所言。伴侶所做的,是為鏈爭取時間與私密空間:它結合住那些裸露的黏性片段,把它們從與鄰居災難性的相遇中遮護起來,然後再鬆手,給鏈又一個安靜的機會去自我摺疊。許多伴侶同時也是熱激蛋白,當發熱或脅迫威脅到要讓全細胞的摺疊紛紛散開時,它們會被額外大量地製造出來。
當摺疊失敗——以及近年預測摺疊的飛躍
正因為摺疊是持續的、緩慢的、又擁擠的,錯誤摺疊便是一種持續的危險——而當安全網失靈時,後果是嚴重的。有些蛋白質會滑進一種另類形狀,露出平坦、黏性的表面,而這種錯誤摺疊形狀的一份份拷貝彼此疊摞,堆成又長又頑固的纖維,稱為澱粉樣。這些沉積物是蛋白質錯誤摺疊疾病——如阿茲海默病和帕金森病——的標誌。最離奇的莫過於朊病毒:一個錯誤摺疊的蛋白質充當模板,碰一碰同種蛋白質的一份正常拷貝,便誘使它照樣錯誤摺疊,於是這個壞形狀從一個分子傳到下一個分子——一場僅憑形狀傳播、不牽涉任何基因的感染。細胞用伴侶來反擊,設法重新摺疊或拆開聚集體,還動用你將在本階後面遇到的清除系統;錯誤摺疊疾病在很大程度上,正是這套防禦被壓垮的結果。
如果序列當真握著答案,那麼有一份誘人的獎賞已在空中懸了五十年:我們能否僅憑序列、用電腦*預測*出摺疊後的形狀,而完全不必碰那個蛋白質?數十年來,這個「蛋白質摺疊問題」出了名地難——哪怕有了漏斗的觀念,要算出 150 個殘基會落到哪裡,仍然把最好的方法都難倒。後來,約莫在 2020 年,一個叫做AlphaFold的深度學習系統實現了真正的飛躍。它不是一步一步地模擬物理,而是從生物學家早已用實驗解出的龐大結構庫、再加上每個蛋白質的序列在物種間如何變異的演化記錄裡,學到了把序列與形狀聯繫起來的規律。對於為數眾多的蛋白質,它如今預測出的摺疊,準確度足以與實驗相媲美——而且它已對數以億計的序列做到了這一點,是給整個生物學的一份厚禮。