相同的 DNA，不同的細胞：調控為何重要

同一本書，每個細胞裡都有——那它們為什麼各不相同？

等你爬到這一級時，你已經從上一級帶來了一個驚人的事實：你體內幾乎每個細胞都攜帶著*同一份*完整的基因組——同樣那條兩米長的 DNA 線，同樣那約兩萬個基因，一個字母都不差。你的肝細胞和腦細胞都是從同一個受精卵複製而來，而複製機器又異常忠實，所以每個細胞手裡的那本書在本質上是一模一樣的。然而，一個神經元——滿是細長分叉的電線、劈裡啪啦地放電——和一個皮膚細胞——扁平、堅韌、忙著替你防水——卻幾乎不能再不同了。它們讀著同一本書，行為卻像截然不同的生物。

這正是整整一級要去解開的謎題，在我們回答它之前，值得讓它先扎得人有點疼。如果指令完全相同，那差別從何而來？它不可能在文本裡，因為文本是一樣的。所以它必定在*文本如何被使用*之中——在每個細胞選擇朗讀哪些段落、又把哪些合著不讀之中。這種選擇有一個你在術語表裡已經見過的名字：[[gene-expression|基因表現]]，也就是細胞把一個基因真正拿來製造出某樣東西的行為。整整一級的答案，用一句話說，就是：不同的細胞表達不同的基因。

差異基因表現：運行程式的一個子集

我們把這一點講具體。在你那約兩萬個編碼蛋白質的基因裡，有相當一批核心基因——所謂的管家基因——幾乎在每個細胞裡都運行著，因為每個細胞都需要產生能量、構建 RNA、並維持自己的存活。但在這層共享的基礎之上，每一種細胞類型會開啟它自己那套特別的基因，讓其餘的保持沉默。這就是差異基因表現：不同的細胞類型表現著同一基因組裡的不同子集。一個胰臟 β 細胞把胰島素基因開到最大音量；一個皮膚細胞攜帶著完全相同的基因，卻從不去讀它，於是它根本不製造胰島素。

還要注意，表現也不是一個簡單的開/關開關。一個基因可以被微弱地低語，也可以扯著嗓子大喊，而*水平*往往和「是與否」一樣重要。兩個細胞或許都表達同一個基因，但一個表達十份、另一個表達一萬份，僅這一點差別就能重塑細胞的所作所為。所以真實的圖景是一塊巨大的混音台，而不是一排電燈開關：成千上萬個推子，每一個都設在自己的位置上，而這套具體的設置——所有基因上的那個模式——正是讓一個細胞成為神經元而非皮膚細胞的原因。

same genome in every cell -- different sliders pushed up

              insulin  keratin  neuron-wiring  housekeeping
  beta cell    |####|   |    |     |    |        |####|
  skin cell    |    |   |####|     |    |        |####|
  neuron       |    |   |    |     |####|        |####|

  identical instructions, different settings = different cells

每個細胞都擁有相同的基因；細胞的身份就是哪些推子被推高的那個模式。管家那一組到處都運行；而專門化的基因則各不相同。

這個控制問題的規模

一旦你把表現看成一塊混音台，接下來要去體會的，就是這個控制問題究竟有多大。一個人體大約要造出兩百種經典的細胞類型——若把現代方法所揭示的那些細微差別也算進去，則遠不止此——每一種都需要在那約兩萬個基因上有自己特徵性的設置。而這些設置並非終生不變：一個肝細胞在餐後把處理糖分的基因調高，幾小時後又調回去；一個免疫細胞在遇到一個微生物的幾分鐘之內，就把自己整套表現譜重寫一遍。細胞並不是把這塊板子設定好一次就完事；它在不斷地重新調音，以回應它身處何地、此刻是什麼時間、以及剛剛發生了什麼。

這裡，上一級的一個數字會突然對上號。你學過，基因組裡真正編碼蛋白質的僅約 1%–2%，其餘大部分是非編碼 DNA——並非垃圾，而是相當大一部分屬於調控性的。現在你能看出*為什麼*一個基因組會拿出這麼大的篇幅來搞控制：讓兩萬個基因在數百種細胞類型、以及一生不斷變化的條件下都設置正確，是一個遠比單純列出零件清單要難得多的問題。那套決定每個零件何時被使用的接線，至少要和零件清單本身一樣精細——而這套接線，正是非編碼基因組的大部分所在之處。

藍圖還是程式？重新理解基因組

人們常把 DNA 稱作*藍圖*，這是個誘人的比喻——但它是錯的，而看清它為什麼錯，正是本篇真正的收穫。藍圖是一張靜止的圖紙，上面每一條線對應著一堵牆：它把成品一部分對一部分、一次性地全畫出來。基因組完全不是這樣。你的 DNA 裡任何地方都沒有一隻手或一隻眼睛的小圖。相反，基因組的表現遠更像一個程式——一套*隨時間運行*的指令，同樣的指令會因為它執行時的條件不同，而產生天差地別的結果。

這一重新理解會改變你在本級裡讀到的一切。程式裡有條件判斷——*如果*這個信號到來，*那麼*就運行那一塊基因。它有彼此調用的子程式，於是撥動一個主開關就能引發一連串連鎖反應。而完全相同的程式碼，餵進不同的輸入，就能在一處造出神經元、在另一處造出皮膚細胞。細胞的開關大多是一類叫轉錄因子的蛋白質，它們結合到 DNA 上，決定哪些基因被讀取；又因為基因通常是由這些因子的*組合*來控制的——即組合調控——一份不大的工具箱就能指定數目龐大的不同結果，就像 26 個字母能拼出數不清的單詞。

這一級接下來要去哪裡

現在你已經握有了問題，也握有了答案的大致形狀；這一級餘下的部分，就是把其中的機器一一填上。我們將從控制最簡單、最清晰的地方開始：細菌，它們把相關的基因綁在共用的開關之下，根據周圍環境裡的食物來撥動它們——這是那個經典、被理解得極為透徹的例子。接著我們跨入我們自己這類細胞，那裡的控制是分層而組合式的，還有從遠處起作用的開關。再往後是更微妙的一層——寫在 DNA *之上*、能在一個字母都不動的情況下改變表現、甚至能被遺傳下去的設置——最後，則是這些控制如何彼此編織成穩定的網路，把一個細胞鎖定在它的身份之中。

在往上爬的過程中，請記住一條貫穿始終的主線。前面每一個機制，其實都是對我們開篇那個問題的回答：從一份共享的基因組裡，一個細胞究竟如何決定運行哪些基因、何時運行、運行得多響？這正是後面發育那一級裡細胞如何選定一份工作背後的引擎，是一個胚胎如何從單個細胞長成的背後引擎，也是疾病中許多差錯的背後引擎——當錯誤的基因被開啟時。那些可遺傳卻又可逆的設置，有一個更深的名字——表觀遺傳學——很快會有專門的一篇小心地講它，剝去它常常招來的那層神秘色彩。調控並不是基因組的一個腳註；它正是基因組如何真正成為一個活物的方式。