同一本書,每個細胞裡都有——那它們為什麼各不相同?
等你爬到這一級時,你已經從上一級帶來了一個驚人的事實:你體內幾乎每個細胞都攜帶著*同一份*完整的基因組——同樣那條兩米長的 DNA 線,同樣那約兩萬個基因,一個字母都不差。你的肝細胞和腦細胞都是從同一個受精卵複製而來,而複製機器又異常忠實,所以每個細胞手裡的那本書在本質上是一模一樣的。然而,一個神經元——滿是細長分叉的電線、劈裡啪啦地放電——和一個皮膚細胞——扁平、堅韌、忙著替你防水——卻幾乎不能再不同了。它們讀著同一本書,行為卻像截然不同的生物。
這正是整整一級要去解開的謎題,在我們回答它之前,值得讓它先扎得人有點疼。如果指令完全相同,那差別從何而來?它不可能在文本裡,因為文本是一樣的。所以它必定在*文本如何被使用*之中——在每個細胞選擇朗讀哪些段落、又把哪些合著不讀之中。這種選擇有一個你在術語表裡已經見過的名字:[[gene-expression|基因表現]],也就是細胞把一個基因真正拿來製造出某樣東西的行為。整整一級的答案,用一句話說,就是:不同的細胞表達不同的基因。
差異基因表現:運行程式的一個子集
我們把這一點講具體。在你那約兩萬個編碼蛋白質的基因裡,有相當一批核心基因——所謂的管家基因——幾乎在每個細胞裡都運行著,因為每個細胞都需要產生能量、構建 RNA、並維持自己的存活。但在這層共享的基礎之上,每一種細胞類型會開啟它自己那套特別的基因,讓其餘的保持沉默。這就是差異基因表現:不同的細胞類型表現著同一基因組裡的不同子集。一個胰臟 β 細胞把胰島素基因開到最大音量;一個皮膚細胞攜帶著完全相同的基因,卻從不去讀它,於是它根本不製造胰島素。
還要注意,表現也不是一個簡單的開/關開關。一個基因可以被微弱地低語,也可以扯著嗓子大喊,而*水平*往往和「是與否」一樣重要。兩個細胞或許都表達同一個基因,但一個表達十份、另一個表達一萬份,僅這一點差別就能重塑細胞的所作所為。所以真實的圖景是一塊巨大的混音台,而不是一排電燈開關:成千上萬個推子,每一個都設在自己的位置上,而這套具體的設置——所有基因上的那個模式——正是讓一個細胞成為神經元而非皮膚細胞的原因。
same genome in every cell -- different sliders pushed up
insulin keratin neuron-wiring housekeeping
beta cell |####| | | | | |####|
skin cell | | |####| | | |####|
neuron | | | | |####| |####|
identical instructions, different settings = different cells這個控制問題的規模
一旦你把表現看成一塊混音台,接下來要去體會的,就是這個控制問題究竟有多大。一個人體大約要造出兩百種經典的細胞類型——若把現代方法所揭示的那些細微差別也算進去,則遠不止此——每一種都需要在那約兩萬個基因上有自己特徵性的設置。而這些設置並非終生不變:一個肝細胞在餐後把處理糖分的基因調高,幾小時後又調回去;一個免疫細胞在遇到一個微生物的幾分鐘之內,就把自己整套表現譜重寫一遍。細胞並不是把這塊板子設定好一次就完事;它在不斷地重新調音,以回應它身處何地、此刻是什麼時間、以及剛剛發生了什麼。
這裡,上一級的一個數字會突然對上號。你學過,基因組裡真正編碼蛋白質的僅約 1%–2%,其餘大部分是非編碼 DNA——並非垃圾,而是相當大一部分屬於調控性的。現在你能看出*為什麼*一個基因組會拿出這麼大的篇幅來搞控制:讓兩萬個基因在數百種細胞類型、以及一生不斷變化的條件下都設置正確,是一個遠比單純列出零件清單要難得多的問題。那套決定每個零件何時被使用的接線,至少要和零件清單本身一樣精細——而這套接線,正是非編碼基因組的大部分所在之處。
藍圖還是程式?重新理解基因組
人們常把 DNA 稱作*藍圖*,這是個誘人的比喻——但它是錯的,而看清它為什麼錯,正是本篇真正的收穫。藍圖是一張靜止的圖紙,上面每一條線對應著一堵牆:它把成品一部分對一部分、一次性地全畫出來。基因組完全不是這樣。你的 DNA 裡任何地方都沒有一隻手或一隻眼睛的小圖。相反,基因組的表現遠更像一個程式——一套*隨時間運行*的指令,同樣的指令會因為它執行時的條件不同,而產生天差地別的結果。
這一重新理解會改變你在本級裡讀到的一切。程式裡有條件判斷——*如果*這個信號到來,*那麼*就運行那一塊基因。它有彼此調用的子程式,於是撥動一個主開關就能引發一連串連鎖反應。而完全相同的程式碼,餵進不同的輸入,就能在一處造出神經元、在另一處造出皮膚細胞。細胞的開關大多是一類叫轉錄因子的蛋白質,它們結合到 DNA 上,決定哪些基因被讀取;又因為基因通常是由這些因子的*組合*來控制的——即組合調控——一份不大的工具箱就能指定數目龐大的不同結果,就像 26 個字母能拼出數不清的單詞。
這一級接下來要去哪裡
現在你已經握有了問題,也握有了答案的大致形狀;這一級餘下的部分,就是把其中的機器一一填上。我們將從控制最簡單、最清晰的地方開始:細菌,它們把相關的基因綁在共用的開關之下,根據周圍環境裡的食物來撥動它們——這是那個經典、被理解得極為透徹的例子。接著我們跨入我們自己這類細胞,那裡的控制是分層而組合式的,還有從遠處起作用的開關。再往後是更微妙的一層——寫在 DNA *之上*、能在一個字母都不動的情況下改變表現、甚至能被遺傳下去的設置——最後,則是這些控制如何彼此編織成穩定的網路,把一個細胞鎖定在它的身份之中。
在往上爬的過程中,請記住一條貫穿始終的主線。前面每一個機制,其實都是對我們開篇那個問題的回答:從一份共享的基因組裡,一個細胞究竟如何決定運行哪些基因、何時運行、運行得多響?這正是後面發育那一級裡細胞如何選定一份工作背後的引擎,是一個胚胎如何從單個細胞長成的背後引擎,也是疾病中許多差錯的背後引擎——當錯誤的基因被開啟時。那些可遺傳卻又可逆的設置,有一個更深的名字——表觀遺傳學——很快會有專門的一篇小心地講它,剝去它常常招來的那層神秘色彩。調控並不是基因組的一個腳註;它正是基因組如何真正成為一個活物的方式。