JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

全基因组关联研究,以及“测出你的基因组”意味着什么

全基因组关联研究如何扫描数百万个 SNP,找出与性状和疾病相关的变异——它能告诉你什么、又不能告诉你什么——以及在今天,把你自己的基因组测出来,老实说究竟意味着什么。

GWAS:在全基因组中扫描关联

全基因组关联研究(GWAS)选取一大群人——比如数千名患有某种状况的人和数千名没有的人——并在两组之间比较数百万个 SNP。对每一个 SNP,它只问一个统计学问题:某个特定字母在一组中是否比在另一组中更常见?那些在病例组中可靠地更频繁出现的 SNP,会被标记为与该性状*相关联*。

GWAS 最适用于复杂性状——身高、血压、糖尿病风险——这些性状没有哪个单一基因说了算。每个相关联的 SNP 都只把概率轻轻推动一点点;成百上千个加在一起才决定方向。把一个人所有提高风险的变异累加起来,便得到一个多基因评分,对遗传倾向的粗略估计。这些评分是跨群体的统计趋势,而不是对任何一个人命运的预测

GWAS in one picture (one SNP among millions):

            has 'G'   has 'A'
  Cases      62%        38%
  Controls   41%        59%
                ^ 'G' enriched in cases
  -> SNP flagged as ASSOCIATED with the trait

Reminder: association != cause.
The 'G' may just ride along with the true variant
nearby (its haplotype), and effect size is small.
GWAS 比较两组之间的 SNP 频率;某个字母富集就标记出一种关联,而非已证实的病因。

那么,“测出你的基因组”究竟意味着什么?

“测出你的基因组”意味着一台仪器读出你那约 32 亿个字母,再由生物信息学把它们与参考基因组相比较,产出一份你与参考序列不同之处的清单。那份清单——你个人的那套变异——才是真正的产物。其中大多数差异是与数百万其他人共有的,单独看并没有任何意义。

  1. 你的 DNA 被测序、比对到参考基因组,再被精简成一份你与之不同之处的变异清单。
  2. 每个变异都被注释:它常见还是罕见、在不在基因里、是无害的还是已知有影响?
  3. 少数变异可能有临床意义;许多则意义不明;一项意外发现还可能浮现出你本来并未在找的东西。
  4. 结果描述的是概率与倾向,而非确定性——而且最好在专业人士的协助下解读。