GWAS:在全基因體中掃描關聯
全基因體關聯研究(GWAS)選取一大群人——比如數千名患有某種狀況的人和數千名沒有的人——並在兩組之間比較數百萬個 SNP。對每一個 SNP,它只問一個統計學問題:某個特定字母在一組中是否比在另一組中更常見?那些在病例組中可靠地更頻繁出現的 SNP,會被標記為與該性狀*相關聯*。
GWAS 最適用於複雜性狀——身高、血壓、糖尿病風險——這些性狀沒有哪個單一基因說了算。每個相關聯的 SNP 都只把機率輕輕推動一點點;成百上千個加在一起才決定方向。把一個人所有提高風險的變異累加起來,便得到一個多基因評分,對遺傳傾向的粗略估計。這些評分是跨群體的統計趨勢,而不是對任何一個人命運的預測。
GWAS in one picture (one SNP among millions):
has 'G' has 'A'
Cases 62% 38%
Controls 41% 59%
^ 'G' enriched in cases
-> SNP flagged as ASSOCIATED with the trait
Reminder: association != cause.
The 'G' may just ride along with the true variant
nearby (its haplotype), and effect size is small.那麼,「定序你的基因體」究竟意味著什麼?
「定序你的基因體」意味著一台儀器讀出你那約 32 億個字母,再由生物資訊學把它們與參考基因體相比較,產出一份你與參考序列不同之處的清單。那份清單——你個人的那套變異——才是真正的產物。其中大多數差異是與數百萬其他人共有的,單獨看並沒有任何意義。
- 你的 DNA 被定序、比對到參考基因體,再被精簡成一份你與之不同之處的變異清單。
- 每個變異都被註釋:它常見還是罕見、在不在基因裡、是無害的還是已知有影響?
- 少數變異可能有臨床意義;許多則意義不明;一項意外發現還可能浮現出你本來並未在找的東西。
- 結果描述的是機率與傾向,而非確定性——而且最好在專業人士的協助下解讀。