JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

從單個基因到整個基因體

「基因體學」在經典遺傳學之上增添了什麼:從一次研究一個基因,放大到讀出某個生物全部 DNA 的每一個字母——以及這種尺度上的改變為何改變了生物學。

遺傳學研究基因;基因體學研究整本書

在 20 世紀的大部分時間裡,遺傳學都是一次研究一個基因。你選定一個性狀,在家系中追蹤它,然後慢慢把單個基因定位到染色體上的某個位置。這種細緻的、逐個基因的方法正是經典遺傳學的核心。而基因體學則是當你徹底放大、一次性研究某個生物體內*全部*DNA時所發生的事——每一個基因,再加上基因之間所有的片段。

基因體就是這座完整的 DNA 圖書館——一個生物體一套染色體上所攜帶的全部字母序列。對人類來說,這大約是 32 億鹼基對。基因體學能提出一些你逐個基因研究時根本無法提出的問題:基因總共有多少個?它們在不同物種之間如何比較?兩個人之間哪些字母不同,這些差異又是否重要?

基因體裡到底有什麼

基因體學揭示了一個令人驚訝的事實:基因只占基因體的一小部分。在那 32 億個字母中,只有大約 1–2% 是編碼蛋白質的編碼 DNA。其餘則是非編碼 DNA——調控開關、RNA 基因、重複序列、間隔序列,以及一些我們至今仍在弄清其功能的序列。讀出整個基因體迫使你認真對待所有這些內容,而不僅僅是那些著名的編碼片段。

Human genome at a glance
-------------------------------------
Total length        ~3,200,000,000 bp
Protein-coding genes ~20,000
Coding DNA           ~1-2% of the genome
Non-coding DNA       ~98%
Chromosomes          22 autosomes + X + Y
-------------------------------------
Reading 1 letter per second, nonstop,
would take you about 100 years.
基因體一覽——也讓你明白為什麼靠人工逐字閱讀從來就不是個選項。

從遺傳學到基因體學的飛躍,只有當我們能夠又快又便宜地讀出 DNA 字母時才成為可能。本專題接下來的內容講的就是基因體定序的故事:我們如何把一個實體分子轉化成一串可以儲存、檢索和比較的 A、C、G、T。首次嘗試讀出整個人類基因體的里程碑——人類基因體計畫——正是下一篇指南的起點。