從幾個電燈開關,到一張調音台
上一篇裡,你看到細菌用一種精簡而迅捷的方式來控制基因:一個 乳糖操縱子把相關的基因歸在同一個開關之下,而一個坐在操縱基因上的阻遏蛋白,要麼擋住轉錄,要麼——當合適的分子出現時——放它進行。這很優雅、很俐落——正是一個每二十分鐘就翻一倍的細胞所需要的。可細菌一次只有一件事要做:活下去、吃東西、分裂。而你的身體,問的是一個難得多的問題。*同一份*基因組,必須既造得出神經元,又造得出皮膚細胞、一個會跳動的心肌細胞,還有數百種別的類型——每一種都讀取這同樣約兩萬個基因裡不同的一小撮,而且要把這套模式穩穩保持一輩子。
光靠區區幾個開/關開關,是做不到這一點的。於是真核生物用簡單換來了控制力。如果說細菌實際上是每個基因配一個電燈開關,那麼你擁有的,更像一張錄音棚的調音台——每個基因配著許多個推桿,每一個都把音量往上或往下推一點,而最終的輸出,取決於所有推桿位置的*整體組合*。這正是貫穿本篇、最要緊的一個轉變:真核生物的基因調控不是一個決定,而是一次投票,是把許多路輸入匯總起來的結果——它與細菌方案的差異之深,足以讓生物學家給它單獨起個名字,即 原核與真核轉錄之分。
轉錄因子:會讀 DNA 的蛋白質
這張調音台上的推桿,是一類叫做轉錄因子的蛋白質。一個轉錄因子,就是一種能結合 DNA 上某一段特定短序列的蛋白質——這段識別序列通常只有寥寥幾個字母長——而它僅僅坐在那裡,就改變了附近某個基因被轉錄的難易程度。這裡的關鍵觀念,是*序列特異性結合*:轉錄因子的形狀只配某一個 DNA「單詞」,就像鑰匙配一把鎖,所以它只落在拼出它那段序列的位點上,而無視其餘數十億個並不匹配的字母。正是靠這一點,一個可以在整個基因組裡四處遊走的蛋白質,最終偏偏作用在那些恰到好處的基因上。
轉錄因子有兩副脾氣。激活物(激活子)會*提高*它所靶向基因的轉錄;阻遏物(阻遏子)則會*降低*它。(這一對激活物/阻遏物,你在細菌操縱子那裡已經見過——零件是一樣的,只不過接線方式變得更豐富了。)但請注意激活物*不*做什麼:它並不親自去寫 RNA。回想轉錄那一級,真正負責抄錄基因的機器,是 RNA 聚合酶。激活物真正的活兒,是幫忙把那台聚合酶(連同它一大群輔助蛋白)招募並穩定在基因的啟動子上——也就是你早已熟悉的那個起點地標。阻遏物則反其道而行:它要麼擋住這場組裝,要麼招來一些把基因鎖死的蛋白質。換句話說,轉錄因子是管理者,而不是幹活的工人。
增強子與沉默子:從遠處起作用的開關
在細菌操縱子裡,那段控制序列就緊挨著它所管轄的基因。而真核生物玩出了一招乍聽上去近乎不可能的把戲:能從*數千*個字母之外、有時甚至從基因另一頭起作用的調控 DNA。這些遠處的控制小塊,就是增強子(把基因調高)與沉默子(把基因調低)。一個增強子,不過是一段攜帶著一簇激活型轉錄因子結合位點的 DNA——可它也許位於基因上游、下游五萬個鹼基對之外,或者乾脆埋在基因當中,卻依然能控制它。
一個開關怎麼能跨越那麼長的 DNA 去夠到基因呢?不是靠沿著 DNA 滑過去——而是靠成環。DNA 是一根柔軟的線,而非僵硬的桿。結合在遠處增強子上的那些轉錄因子,會抓住聚集在基因啟動子處的那套蛋白機器,於是夾在中間的 DNA 乾脆彎成一個環,把相隔甚遠的兩個位點拉到面對面。中間那數千個字母,則像旁觀者一樣鼓在環外。這與其說像撥動檯燈旁牆上的開關,不如說更像一根長長的接線板,讓房間另一頭的一個開關,夠到了同一個插座。
enhancer (far away) promoter + gene
[ TF ][ TF ][ TF ] [ ===> gene ====>
----==================== ... thousands of bp ... ====------------------
\ /
DNA bends into a \____ loops around ___/ the bound factors
loop, bringing (the in-between touch the polymerase
enhancer + promoter DNA bulges out) machinery at the
physically together promoter -> gene ON正是這種成環的幾何關係,讓一個基因能聽命於許多個增強子,而每個增強子各自在不同的組織或時刻活躍。一個基因或許帶著一個只在神經元裡點火的增強子、另一個只在肝臟裡點火、還有一個只在發育早期點火——而究竟形成哪些環,就決定了這個基因在何處、何時開口。沉默子則是它的鏡像:同樣的遠程成環,只不過它送來的是阻遏物,而非激活物。不過這裡有一處微妙之處要誠實交代:在實際中,增強子和啟動子並不是來者不拒地亂配。一些絕緣子序列,以及基因組在三維空間裡的摺疊方式,會把每個增強子圈攏向它該去的那個基因,所以這些環是受到引導的,而非隨機形成——這是一個活躍的研究領域,也提醒我們:那張整潔的示意圖,其實藏著實打實的機制。
組合調控:意義來自組合
調音台這個比方的好處,正是在這裡兌現的。一個增強子幾乎從不只帶一個結合位點;它帶著一簇,供好幾個*不同的*轉錄因子結合。一個基因通常只在*恰當的那一組*轉錄因子同時到場時才會強力開啟——比方說,要因子 A、因子 B 和因子 C 全都結合上去,同時還沒有阻遏物坐在沉默子上。其中任何一個因子單獨存在,可能幾乎不起作用,甚至毫無作用。這就是組合調控:輸出是從輸入的*組合*裡讀出來的,而非取決於任何單一的輸入。細胞問的不是一個是/否的問題;它在運行一道邏輯門。
組合,正是為什麼一套並不龐大的工具箱,就能指定出極其豐富的多樣性。比方說,哪怕只有幾百個轉錄因子,你能點亮的*不同組合*數目也是天文數字——遠遠多於你所需要的細胞類型數。所以細胞並不需要專門弄一個「神經元因子」或「皮膚因子」。相反,每一種細胞類型,都是由恰好到場的那一*組*共享、可複用的因子來定義的。想想區區 26 個字母,是怎樣拼出字典裡每一個單詞的:力量不在字母本身,而在它們的組合。轉錄因子,就是細胞用來書寫「身份」的字母表。
守門人:染色質決定哪些內容根本讀不讀得到
前面這一切——因子、增強子、成環——都默認一個轉錄因子真的*夠得到*它在 DNA 上的位點。可回想一下基因組那一級講染色質的那一篇:真核 DNA 並不是裸露的。它纏繞在蛋白質「線軸」上、被打包起來,有時鬆散,有時則被壓成密實、幾乎完全讀不出來的一團。這層包裝,位於我們剛討論過的每一個開關的下面,因為一個埋在緊實包裝裡的結合位點,根本就是隱形的——沒有哪個因子能停靠在它碰都碰不到的 DNA 上。
於是,打包的密實程度,就充當了一道總閘門。鬆散打包、敞開著的染色質(常染色質)是可及的:因子能結合、聚合酶能幹活、基因能被讀取。密實打包的染色質(異染色質)則是關閉的、大體沉默的——基因被實實在在地鎖了起來。細胞用染色質重塑來控制這件事:一些機器消耗能量去推動、鬆開或趕走那些「線軸」,從而把某個區域打開,或把它關上。一台重塑機器能清出一條通路,讓一個激活物終於夠得著它的增強子——這也正是為什麼,打開染色質往往是開啟一個基因的*第一步*,發生在任何轉錄因子起作用之前。
這裡有一個漂亮的「先有雞還是先有蛋」的循環,值得看個清楚。有一些特殊的轉錄因子——「先鋒」因子——甚至能結合到關閉的染色質上,並招來重塑機器把它撬開;這一打開,又讓*別的*因子得以蜂擁而入。所以,可及性與因子結合,是彼此塑造的。眼下,先把那個簡單而誠實的版本記住:在真核生物裡,DNA 的開放與關閉狀態,本身就是一個獨立的調控層,凌駕於那些開關之上——而細胞究竟是*如何*設定並記住這套開/關模式的,正是下一篇講表觀遺傳學時要接手的問題。
把它串起來:分層的控制,一個細胞、一個細胞地實現
退後一步,把這幾層疊起來看。首先,染色質必須被打開,DNA 才談得上讀不讀得到。然後,轉錄因子——激活物與阻遏物——結合到它們各自特定的序列上,既在啟動子處,也在那些也許相隔甚遠、靠成環夠進來的增強子和沉默子處。最後,基因依據在場因子的*整體組合*——也就是細胞那道邏輯門——而開啟(或關閉)。每一層都是一個關卡;唯有當它們全部對齊,轉錄才會發生。這種層層疊加,正是「分層而組合式」這句話真正的含義。
現在,本級開篇的那個謎題就解開了。一個神經元和一個皮膚細胞帶著完全相同的 DNA,卻天差地別,原因在於它們擁有*不同的染色質地貌*,以及*不同的轉錄因子組合*——於是被打開、被開啟的,是不同的一套基因。基因表達——究竟哪些基因被讀取、讀得有多響——才是細胞身份真正的來源,而這套組合式、分層式的方案,正是一份基因組造出數百種穩定而各異細胞類型的辦法。這個主題,會一路把你領向階梯後面的細胞分化。