真核生物調控的層層關卡

一份基因組，幾百種細胞：這一級要解開的謎題

請先在心裡記住一個奇怪的事實。你腦中放電的一個神經元，和鋪在你腸道裡的一個細胞，都源自同一個受精卵，而且——除少數罕見例外——它們帶著*完全相同*的 DNA，正是我們討論基因組時見過的那約兩萬個蛋白質編碼基因。可神經元長出長達一米的「電線」，腸道細胞卻拼命泵出消化酶。它們的外觀、行為、乃至化學本質都天差地別。如果每個細胞裡的說明書都一樣，那是什麼讓這些細胞走向分岔？

答案正是這整整一級的核心：細胞之間的差別，不在於它們*擁有哪些*基因，而在於它們*開啟哪些*基因。每種細胞從同一本書裡讀取不同的頁碼組合。神經元表達它的神經元基因、讓腸道基因保持沉默；腸道細胞則反過來。這把基因型與表型之間的鴻溝活生生地展現出來——一種基因型，多種表型，全由[[gene-regulation-principle|基因調控]]雕琢而成。分化，即一個通用細胞最終決定要做肝細胞還是神經元的過程，歸根結底就是一長串關於「表達什麼、抑制什麼」的調控決策。

為何真核生物比細菌需要更多旋鈕

在上一級裡，你見識了細菌如何以令人欽佩的節儉解決調控。操縱子把相關基因歸在同一個開關之下，一個阻遏蛋白在操縱基因上滑進或滑出，就能讓整條通路停擺或運轉——lac 與 trp 開關正是乾淨俐落的教科書範例。細菌負擔得起這種極簡。它沒有細胞核，於是核糖體在 mRNA 還在被轉錄時就開始翻譯它；它那條單一的環狀染色體相對裸露地漂著；而它的主要任務，是對所泡身其中的「湯水」作出快速反應。

真核細胞在每條戰線上都面對更難的問題，這正是為何原核與真核之分在調控上表現得如此鮮明。它的基因組龐大、緊緊纏繞在蛋白質上，所以一個基因可能在物理上被深埋、夠不著。它的 mRNA 在細胞核裡造出，必須先經加工、再被運出，才能讓任何一個核糖體見到它——這就開闢出整整幾個細菌根本沒有的環節。而且它不只是在對一處食物源作反應：它在搭建一具擁有幾百種細胞類型的身體，每一種都得開啟一套精確、穩定、長久的程序，並把它*記住*一輩子。要求越多，可供介入的關卡也就越多。

從 DNA 到工作蛋白的調控階梯

下面就是那個統攝全局的想法，要帶著它走過本級的每一篇指南。回想你從一開始就熟知的那條流向 DNA -> RNA -> 蛋白質。真核細胞可以在*這條路上的每一步、乃至這條路之後*去微調產出。所有這些介入點合在一起，就是我們所說的[[levels-of-gene-control|基因調控的層級]]。想像一條河上設著一連串水壩：細胞可以在其中任何一座攔下水流，而最終造出的工作蛋白有多少，取決於穿過了所有這些閘門之後還剩下多少。

DNA in chromatin
   |  (1) chromatin access  -- is the gene reachable at all?
   v
gene + regulators
   |  (2) transcription     -- is RNA polymerase switched on here?  <-- biggest dam
   v
pre-mRNA
   |  (3) RNA processing     -- splicing, cap, tail: which mRNA is made?
   v
mature mRNA  --export-->  cytoplasm
   |  (4) mRNA stability     -- how long does the message survive?
   v
ribosome
   |  (5) translation        -- is the message actually read?
   v
protein
   |  (6) protein activity   -- modified, folded, switched on?
   |  (7) protein turnover   -- and when is it destroyed?
   v
working protein (the real output)

從基因到工作蛋白這條河上的七座水壩。本級後續的每篇指南，都會打開其中一兩座。

染色質可及性——一個基因要被讀取之前，必先在物理上被暴露出來。DNA 纏繞在組蛋白上，緊密堆疊的異染色質把基因藏起來，而疏鬆的常染色質則把它們呈現出來。滑動並解開這些「線軸」，是第一道把門的決策。
轉錄——迄今最大的一座水壩。叫做轉錄因子的蛋白質結合在 DNA 上，或招募 RNA 聚合酶、或阻擋它，從而決定一個基因究竟要不要被抄、抄得多勤。大多數調控就發生在這裡。
RNA 加工——原始轉錄本會被加帽、加尾、並剪接。通過可變剪接，一個基因能被剪貼成好幾種不同的 mRNA，於是同一個基因在不同細胞裡產出不同的蛋白質。
mRNA 的穩定性與定位——一條能存留幾個小時的訊息，所造出的蛋白質遠多於一條幾分鐘就被銷毀的；細胞還能先把一條 mRNA 運到某個精確的角落，再放它被讀取。
轉譯——即便是一條穩定的 mRNA，也可能被擱置不讀。細胞能調節核糖體上信息的難易程度，從而在不動基因的情況下，迅速把整批蛋白質開啟或關閉。
蛋白質的活性與週轉——一個造好的蛋白質仍不是定論。各種修飾把它開啟或關閉，而泛素—蛋白酶體系統給老舊或多餘的蛋白質打上標籤、送去銷毀，於是其工作水平既取決於造得多快、也取決於清除得多快。

兩點需要誠實說明。第一，這些水壩並不等量齊觀：轉錄、尤其是「是否*開始*轉錄」這個決定，無疑是占主導地位的一座，因為在投入資源去抄錄之前先把一個基因攔下，代價最低。後面的幾座水壩確有其用，但多半是微調。第二，這些閘門並非彼此獨立——它們會相互對話。打開染色質的那套機器，往往同時招募轉錄因子；而一條轉錄本被製造的方式，也可能為它在下游標定某種命運。請把這套階梯看作一個相互連通的控制系統，而非七個孤立的水龍頭。

組合調控：為何寥寥幾個因子能造出那麼多種細胞

這裡潛伏著一個合理的疑問。如果人類只有約兩萬個蛋白質編碼基因，而轉錄因子本身也不過是蛋白質，那麼如此樸素的一套工具，怎能指明幾百種各不相同的細胞類型？答案是[[molbio-combinatorial-control|組合調控]]：一個基因很少由某個總開關單獨撥動，它的開關狀態，是從當下同時在場的調控因子*組合*中讀出的——因子 A 加 B 加 C 也許能點燃一個基因，而單憑 A 或 B 它仍保持沉默。這就像一把鎖，只有正確的一組鑰匙一齊轉動才能打開。

算術才是這話的妙處所在。僅憑約 20 個因子，每個只取「在場」或「缺席」，原則上你就能區分出 2 的 20 次方——一百多萬——種不同的組合，遠多於一具身體裡的細胞類型。這正是為何基因組的大小和基因的數目並不與複雜度掛鉤：力量不在於擁有更多基因，而在於一套固定的基因可被組合、連線在一起的方式多到天文數字。這些連線構成一張基因調控網絡，其中一些因子去撥動另一些因子，而細胞的身份，就是整張網絡最終穩定下來的那個狀態格局。

記憶：細胞如何守住自己是誰

還有一塊拼圖補全了整幅圖景，也正是它給了這一級它的名字。一個肝細胞並非一次性地*成為*肝細胞就完事；它必須在無數次分裂中*始終是*肝細胞，哪怕當初為它選定命運的那些轉錄因子早已來了又走。細胞需要記憶。這份記憶寄居在[[molbio-epigenetics|表觀遺傳]]之中——這是疊加在 DNA 序列之上的可遺傳標記（前綴 *epi-* 意為「在……之上」），它們在不改動遺傳密碼任何一個字母的前提下，調整基因被讀取的方式。基因型紋絲未動；被遺傳下去的，是加在它上面的一項設定。

這些標記是化學的「便利貼」——加在 DNA 上、或加在它所纏繞的組蛋白上的小標籤——而關鍵的訣竅在於：它們能在每次分裂時把自己複製給子代細胞。於是一套「讀這個、靜默那個」的格局，被沿著一支細胞譜系傳遞下去，肝細胞的後代因此可靠地仍是肝細胞。我們很快就會細看這些具體的標記，但現在先記住它的輪廓：轉錄因子*做出*決定；表觀遺傳標記*記住*這個決定。

接下來的路線圖

你現在已經握住了框架；這一級餘下的內容會把它填滿。接下來的幾篇指南，沿著這套調控階梯一層一層往下走：轉錄因子及其結合的增強子，決定一個基因被暴露還是被深埋的染色質包裝，最後是那些讓細胞記住自己選擇、並傳遞下去的表觀遺傳標記——DNA 甲基化與組蛋白密碼。每當後面某篇指南深鑽進某一種機制時，請把它放回本篇這條「水壩之河」，並每次都問同一個問題：這道閘門處在哪一步，它又是如何抬高或壓低最終造出的工作蛋白之量的？

凌駕於這一切之上，請守住一顆北極星。你即將研習的每一個層級，都是為了回答細胞對它那約兩萬個基因中的每一個、時時刻刻發出的同一個問題：這一個該不該開，又該開多少？把這個決定在整個基因組上成千上萬倍地放大，讓它穩定下來，再讓它可被遺傳——你就解釋清楚了：一份固定的基因組，如何舒展成肝細胞、神經元，以及每一個無疑就是「你」的其他細胞。