GWAS:在全基因组中扫描关联
全基因组关联研究(GWAS)选取一大群人——比如数千名患有某种状况的人和数千名没有的人——并在两组之间比较数百万个 SNP。对每一个 SNP,它只问一个统计学问题:某个特定字母在一组中是否比在另一组中更常见?那些在病例组中可靠地更频繁出现的 SNP,会被标记为与该性状*相关联*。
GWAS 最适用于复杂性状——身高、血压、糖尿病风险——这些性状没有哪个单一基因说了算。每个相关联的 SNP 都只把概率轻轻推动一点点;成百上千个加在一起才决定方向。把一个人所有提高风险的变异累加起来,便得到一个多基因评分,对遗传倾向的粗略估计。这些评分是跨群体的统计趋势,而不是对任何一个人命运的预测。
GWAS in one picture (one SNP among millions):
has 'G' has 'A'
Cases 62% 38%
Controls 41% 59%
^ 'G' enriched in cases
-> SNP flagged as ASSOCIATED with the trait
Reminder: association != cause.
The 'G' may just ride along with the true variant
nearby (its haplotype), and effect size is small.那么,“测出你的基因组”究竟意味着什么?
“测出你的基因组”意味着一台仪器读出你那约 32 亿个字母,再由生物信息学把它们与参考基因组相比较,产出一份你与参考序列不同之处的清单。那份清单——你个人的那套变异——才是真正的产物。其中大多数差异是与数百万其他人共有的,单独看并没有任何意义。
- 你的 DNA 被测序、比对到参考基因组,再被精简成一份你与之不同之处的变异清单。
- 每个变异都被注释:它常见还是罕见、在不在基因里、是无害的还是已知有影响?
- 少数变异可能有临床意义;许多则意义不明;一项意外发现还可能浮现出你本来并未在找的东西。
- 结果描述的是概率与倾向,而非确定性——而且最好在专业人士的协助下解读。