遺傳學研究基因;基因體學研究整本書
在 20 世紀的大部分時間裡,遺傳學都是一次研究一個基因。你選定一個性狀,在家系中追蹤它,然後慢慢把單個基因定位到染色體上的某個位置。這種細緻的、逐個基因的方法正是經典遺傳學的核心。而基因體學則是當你徹底放大、一次性研究某個生物體內*全部*DNA時所發生的事——每一個基因,再加上基因之間所有的片段。
基因體就是這座完整的 DNA 圖書館——一個生物體一套染色體上所攜帶的全部字母序列。對人類來說,這大約是 32 億個鹼基對。基因體學能提出一些你逐個基因研究時根本無法提出的問題:基因總共有多少個?它們在不同物種之間如何比較?兩個人之間哪些字母不同,這些差異又是否重要?
基因體裡到底有什麼
基因體學揭示了一個令人驚訝的事實:基因只占基因體的一小部分。在那 32 億個字母中,只有大約 1–2% 是編碼蛋白質的編碼 DNA。其餘則是非編碼 DNA——調控開關、RNA 基因、重複序列、間隔序列,以及一些我們至今仍在弄清其功能的序列。讀出整個基因體迫使你認真對待所有這些內容,而不僅僅是那些著名的編碼片段。
Human genome at a glance ------------------------------------- Total length ~3,200,000,000 bp Protein-coding genes ~20,000 Coding DNA ~1-2% of the genome Non-coding DNA ~98% Chromosomes 22 autosomes + X + Y ------------------------------------- Reading 1 letter per second, nonstop, would take you about 100 years.
從遺傳學到基因體學的飛躍,只有當我們能夠又快又便宜地讀出 DNA 字母時才成為可能。本專題接下來的內容講的就是基因體定序的故事:我們如何把一個實體分子轉化成一串可以儲存、檢索和比較的 A、C、G、T。首次嘗試讀出整個人類基因體的里程碑——人類基因體計畫——正是下一篇指南的起點。