從全基因組到可疑區域
若一個多基因性狀散布在許多基因上,沒有任何單個龐納特方格能找到它們。遺傳學家轉而搜尋數量性狀基因座(QTL):基因組上的一段——一個基因座——其遺傳差異在統計上與性狀差異相關聯。QTL 並不鎖定某一個基因;它標記出一個區域,其中攜帶著一個或多個把性狀往上或往下推的變異。
其現代、高分辨率的版本是全基因組關聯研究(GWAS)。它在數萬人身上掃描數百萬個常見的單字母變異——單核苷酸多態性,即 SNP——在每一處都問:攜帶這個變異是否會平均地改變該性狀? 任何單個 SNP 的答案通常是極微小的效應,而這正是當數百個變異各自只貢獻一絲時我們所預期的。
GWAS, one SNP at a time (toy numbers):
SNP at position chr2:18,455,201, alleles G / A
--------------------------------------------------
genotype mean height (cm) count
GG 171.0 4200
GA 171.4 5100
AA 171.8 2300
--------------------------------------------------
Each 'A' adds ~0.4 cm on average -> tiny, but real.
Repeat across ~1,000,000 SNPs. A handful pass the strict
genome-wide significance bar (p < 5e-8). Together, many
small effects add up to a meaningful chunk of variation.把效應加起來
一旦 GWAS 估出了每個變異的效應,你就可以為單個人把它們加起來,得到一個多基因評分:數出此人攜帶的每個使性狀升高的等位基因,按其估計效應加權,再求和。結果是一個數字,估計該個體相對於群體的遺傳傾向。
有一個需要誠實指出的缺口。GWAS 所能解釋的性狀變異往往少於遺傳率估計所暗示的應有之數——即著名的「缺失的遺傳率」。其中一部分藏在 GWAS 捕捉不到的罕見變異裡,一部分藏在顯著性門檻以下眾多極微小的效應裡,一部分藏在微妙的基因—環境交互作用裡。複雜性狀的地圖是真實的,但邊緣仍然模糊。