JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

染色體、端粒與基因組的建築結構

把染色體當作一個完整打包、可被複製的單元來認識——它的著絲粒、端粒和複製起點——再退後一步,看看DNA在三維空間中的折疊如何決定哪些基因被讀取。

從折疊的纖維到成型的染色體

走到本階這一步,你已經跟著DNA一路從一根赤裸的兩米長線,經過核小體——纏繞在組蛋白線軸上的DNA——進入那把整個基因組塞進細胞核的高級折疊。本篇走最後一步:再次拉遠視角,看看那個成型的包裹——染色體。染色體不只是「一大團盤繞的DNA」;它是一個完整、能自我維持的單元,由一條長長的DNA分子加上它全部的包裝蛋白構成,攜帶著它被複製並完好無損地傳下去所需的一切。

這裡有第一個常把人絆倒的地方:那個標誌性的X形、兩條臂在「腰」處被掐緊的樣子,並不是染色體平時的模樣。那個整齊的X,是一條染色體被逮在細胞分裂當口的樣子——已完全凝縮、且已複製完畢,所以這個X其實是兩份一模一樣的姐妹拷貝在腰部黏在一起。在細胞一生的大部分時間裡,DNA都鬆散得多——鬆到足以被讀取和複製——在顯微鏡下看上去會是一團彌散的亂麻,而不是一個工整的字母。記住這點:X形是某個戲劇性瞬間的快照,而不是日常狀態。

讓DNA成為真正染色體的三個地標

一段DNA本身還算不上一條能工作的染色體。要想一代又一代地經得起被複製、被拉扯分開,它需要三類功能性的地標。想像一條你得粗手粗腳操作的長絲帶:它需要中間一個結實的夾子供抓握,兩端的保護帽以免散開,以及若干標好的、可以開始複製的起點。這三者就是著絲粒、端粒和複製起點——它們如此不可或缺,以至於任何想從零構建人工染色體的人,都必須把這三者全都備齊。

著絲粒就是那個「腰」——一個特化區域,在細胞分裂時,一種叫動粒的蛋白質平台在此組裝,讓細胞的紡錘絲得以抓住染色體、把兩份姐妹拷貝拖向相反的兩端。一旦出錯,子細胞就會落得染色體數目不對,唐氏綜合症這類狀況背後正是這種錯誤。有一個需要誠實點出的微妙之處:在人類中,著絲粒坐落在大塊重複的衛星DNA之中,但定義它的與其說是某段精確序列,不如說是一種特殊的組蛋白和染色質狀態——所以「著絲粒就是某段特定序列」是一種過度簡化。

最後,複製起點是那些標好的位點,複製機器在此被裝載、開始複製DNA。細菌的環狀染色體通常只有一個起點,而每條巨大的真核染色體則有許多個、並行啟動,因為若只從單個起點去複製三十億鹼基對,根本來不及在細胞需要分裂之前完成。於是著絲粒負責分配,端粒保護末端,複製起點讓及時的複製成為可能——三個安靜的結構特徵,做著三件各不相同卻都不可或缺的工作。

端粒:為什麼末端需要帽子

端粒值得單獨說一段,因為「線性」製造了一個環狀結構從不會遇到的奇特難題:末端。端粒是每條染色體臂的尖端,由一小段一遍遍重複的序列構成——在人類中是六字母單元TTAGGG,疊成上千個拷貝——並被保護性蛋白包裹。它們的第一項工作是偽裝。細胞時刻在掃描斷裂的DNA,而一個赤裸的染色體末端,看起來恰恰像一個危險的雙鏈斷裂。若任其裸露,修復機器就會試圖通過把兩條染色體融合在一起來「修好」它,這是災難性的。端粒帽發出的信號是:「這是一個正經的末端,不是損傷——別動它。」

它們的第二項工作,解決的是所謂的末端複製問題。回想複製那幾篇:DNA複製需要一小段RNA引物來起頭,而且只朝5'到3'的方向進行。在線性染色體的最尖端,下游已沒有空間去鋪下那最後一段引物,於是每個末端都有一小段無法被複製。因此每當細胞分裂一次,染色體末端就略微變短一點——就像一句話每被複述一遍,末尾就掉一兩個詞。若沒有補救,關鍵的基因終將被一點點啃掉。

細胞的解法是一種叫端粒酶的酶,它自帶一小段RNA模板,並用它把新鮮的TTAGGG重複重新添回末端,給緩衝區補貨。這裡的誠實很重要:端粒酶在生殖細胞和幹細胞中高度活躍,但在普通體細胞中大體被關閉,所以我們大多數細胞確實會隨年齡增長而縮短端粒,而這是衰老生物學的一條線索——僅僅是一條。更糟的是,許多癌症存活下來,靠的恰恰是把端粒酶重新打開,逃脫那個本該阻止受損細胞永遠分裂下去的限制。端粒不是一個你能往回撥的簡單「青春時鐘」;它們正處在衰老與癌症的真正交叉口上。

核型:基因組的目錄

從一條染色體拉遠到整一套,你就來到了核型:一張把細胞全部凝縮染色體拍下、剪出、再按大小和形狀整理成一對對的照片,像是基因組在整條染色體層面的一幅全家福。人類的核型是46:二十二對相互配對的常染色體,加上一對性染色體,典型女性寫作46,XX,典型男性寫作46,XY。由於每條染色體都呈現出可重現的帶型,受過訓練的眼睛一眼就能看出缺失、多出或重排的染色體——這正是核型分析成為臨床遺傳學主力工具的原因。

對染色體進行計數和配對,引出一個相伴的概念:倍性,即一個細胞攜帶多少套完整的染色體組。你大多數體細胞是二倍體(2n)——每種染色體兩份,分別遺傳自父母雙方——而卵子和精子是單倍體(n),各攜帶一套,從而讓受精恢復二倍體的數目。值得直接點明:一個常見的誤解是「一條染色體就等於一份基因組」。並非如此;在一個二倍體細胞裡,基因組以兩份存在,分散在那一對對配對的染色體上。許多植物和一些動物是多倍體,攜帶三套、四套或更多完整組——比如麵包小麥就攜帶六套。

基因組建築:基因在三維空間中所處的位置

到目前為止,我們幾乎一直把染色體當作一條一維的絲帶來對待。但在活細胞核內,它被折疊成一個三維形狀,而這個形狀並不是隨機的雜亂——它本身就是一層信息。你已經見過它的一個後果:一個區域被包裝得多緊,決定了其中的基因究竟能否被讀取。鬆散、易接近的常染色質容納著大多數活躍的基因;緻密盤繞的異染色質則大多沉默。一個基因在折疊後的基因組中的「地址」,可以在不改變它序列中任何一個字母的情況下把它開或關。

折疊還做了一件更微妙的事:它把DNA上相距遙遠的片段拉到物理上的接觸。一個增強子——提升某基因表達的調控開關——在線性序列上也許遠在數十萬個字母之外,然而一個環可以把它折疊到它所控制的基因正旁邊,就像把一根線繞成環、讓線上相隔很遠的兩個點湊到一起。基因組把這些環組織成叫拓撲關聯結構域(TAD)的「鄰里」:這些區域內部的DNA彼此接觸的頻率,遠高於它們與隔壁區域的接觸。在一個TAD之內,增強子找到它們應有的靶基因;跨過邊界,它們就與那些本不該被它們控制的基因相隔絕。

一個環是怎麼形成的?目前主流的圖景是環擠出:一種環狀蛋白(黏連蛋白)抓住DNA、把它穿過自身捲動,捲出一個不斷增大的環,直到撞上由一種叫CTCF的蛋白結合的邊界標記,後者就像擋塊。回報既真實又關乎臨床:當一個邊界被刪除,增強子就可能溢入相鄰的結構域、開啟一個它本不該觸及的基因——這種「重新接線」與發育障礙及某些癌症相關聯。不過,要對這個前沿誠實:TAD是在大量細胞上平均得到的統計性、動態性特徵,而非在每個細胞、每一刻都一模一樣存在的剛性隔牆。三維基因組組織是一個年輕、高速發展的領域,其定義和細節仍在爭論之中。

Linear sequence:   ...[enhancer]-----------------(500 kb)-----------------[gene]...

Folded in 3D (one TAD):
        [enhancer]                                   loop brings them together
              \                                     /
               \___________ loop __________________/
                              ||  <-- enhancer now touches the gene -> ON

   CTCF boundary   |==== TAD ====|   CTCF boundary   |==== next TAD ====|
   (a stopper)                       (a stopper)

   Delete a boundary  ->  enhancer spills into the next TAD  ->  wrong gene switched ON
折疊把一個遙遠的增強子帶到它在TAD內的基因旁;邊界則阻止它伸進下一個TAD。

為什麼建築結構是信息,而不只是收納

退後一步,本階的主線便驟然清晰。把兩米長的DNA塞進細胞核,從來就不只是一個收納整潔的問題;在每一個層級——核小體、纖維、環、TAD、染色體領地——包裝都兼任調控。那把存儲問題解決了的同一種折疊,也決定了哪些基因能被夠到、哪些增強子遇見哪些啟動子、哪些片段被鎖著不放。這在很大程度上解釋了為什麼一個神經元和一個白血球、攜帶著完全相同的DNA序列,外形和行為卻毫不相像:它們的差別不在於存了什麼,而在於這份共享的基因組如何被折疊、被包裝、被讀取。

把真核生物的故事與細菌的故事作個對照也很值得。細菌把它緊湊、基因密集的基因組放在擬核裡一條環狀染色體上,幾乎沒有非編碼DNA,不需要端粒,通常也只有一個複製起點——一種精簡的設計,沒有細胞核可供折疊成繁複的領地。而那龐大、用染色質包裝、端粒封蓋、由TAD組織的真核染色體,是對「存儲並使用一個基因組」這同一難題的一種根本不同的解法。兩者誰都不「更先進」;它們是適應兩種生活方式的兩種建築結構。