JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

全基因體關聯研究,以及「定序你的基因體」意味著什麼

全基因體關聯研究如何掃描數百萬個 SNP,找出與性狀和疾病相關的變異——它能告訴你什麼、又不能告訴你什麼——以及在今天,把你自己的基因體定序出來,老實說究竟意味著什麼。

GWAS:在全基因體中掃描關聯

全基因體關聯研究(GWAS)選取一大群人——比如數千名患有某種狀況的人和數千名沒有的人——並在兩組之間比較數百萬個 SNP。對每一個 SNP,它只問一個統計學問題:某個特定字母在一組中是否比在另一組中更常見?那些在病例組中可靠地更頻繁出現的 SNP,會被標記為與該性狀*相關聯*。

GWAS 最適用於複雜性狀——身高、血壓、糖尿病風險——這些性狀沒有哪個單一基因說了算。每個相關聯的 SNP 都只把機率輕輕推動一點點;成百上千個加在一起才決定方向。把一個人所有提高風險的變異累加起來,便得到一個多基因評分,對遺傳傾向的粗略估計。這些評分是跨群體的統計趨勢,而不是對任何一個人命運的預測

GWAS in one picture (one SNP among millions):

            has 'G'   has 'A'
  Cases      62%        38%
  Controls   41%        59%
                ^ 'G' enriched in cases
  -> SNP flagged as ASSOCIATED with the trait

Reminder: association != cause.
The 'G' may just ride along with the true variant
nearby (its haplotype), and effect size is small.
GWAS 比較兩組之間的 SNP 頻率;某個字母富集就標記出一種關聯,而非已證實的病因。

那麼,「定序你的基因體」究竟意味著什麼?

「定序你的基因體」意味著一台儀器讀出你那約 32 億個字母,再由生物資訊學把它們與參考基因體相比較,產出一份你與參考序列不同之處的清單。那份清單——你個人的那套變異——才是真正的產物。其中大多數差異是與數百萬其他人共有的,單獨看並沒有任何意義。

  1. 你的 DNA 被定序、比對到參考基因體,再被精簡成一份你與之不同之處的變異清單。
  2. 每個變異都被註釋:它常見還是罕見、在不在基因裡、是無害的還是已知有影響?
  3. 少數變異可能有臨床意義;許多則意義不明;一項意外發現還可能浮現出你本來並未在找的東西。
  4. 結果描述的是機率與傾向,而非確定性——而且最好在專業人士的協助下解讀。