从全基因组到可疑区域
若一个多基因性状散布在许多基因上,没有任何单个庞纳特方格能找到它们。遗传学家转而搜寻数量性状基因座(QTL):基因组上的一段——一个基因座——其遗传差异在统计上与性状差异相关联。QTL 并不锁定某一个基因;它标记出一个区域,其中携带着一个或多个把性状往上或往下推的变异。
其现代、高分辨率的版本是全基因组关联研究(GWAS)。它在数万人身上扫描数百万个常见的单字母变异——单核苷酸多态性,即 SNP——在每一处都问:携带这个变异是否会平均地改变该性状? 任何单个 SNP 的答案通常是极微小的效应,而这正是当数百个变异各自只贡献一丝时我们所预期的。
GWAS, one SNP at a time (toy numbers):
SNP at position chr2:18,455,201, alleles G / A
--------------------------------------------------
genotype mean height (cm) count
GG 171.0 4200
GA 171.4 5100
AA 171.8 2300
--------------------------------------------------
Each 'A' adds ~0.4 cm on average -> tiny, but real.
Repeat across ~1,000,000 SNPs. A handful pass the strict
genome-wide significance bar (p < 5e-8). Together, many
small effects add up to a meaningful chunk of variation.把效应加起来
一旦 GWAS 估出了每个变异的效应,你就可以为单个人把它们加起来,得到一个多基因评分:数出此人携带的每个使性状升高的等位基因,按其估计效应加权,再求和。结果是一个数字,估计该个体相对于群体的遗传倾向。
有一个需要诚实指出的缺口。GWAS 所能解释的性状变异往往少于遗传率估计所暗示的应有之数——即著名的“缺失的遗传率”。其中一部分藏在 GWAS 捕捉不到的罕见变异里,一部分藏在显著性门槛以下众多极微小的效应里,一部分藏在微妙的基因—环境交互作用里。复杂性状的地图是真实的,但边缘仍然模糊。