從一個家庭到整個群體
經典的孟德爾遺傳學在一個家庭內追蹤等位基因——從父母到後代。群體遺傳學則把視角徹底拉遠:它把整個可互相交配的群體當作一個單位,去問每個等位基因有多常見,以及這種常見程度是否會隨世代改變。
核心的抽象概念是基因庫:想像把某個基因座上每個個體攜帶的所有等位基因都倒進同一個袋子裡。一個由 100 個個體組成的二倍體群體,在每個基因座上攜帶 200 個等位基因。一個等位基因的頻率,就是它在這個袋子裡所佔的份額——一個介於 0 和 1 之間的數。
基因型頻率 vs. 等位基因頻率
你可以數兩樣東西。基因型頻率是帶有各種基因型(AA、Aa、aa)的個體所佔的比例。等位基因頻率是基因庫中各等位基因拷貝(A 與 a)所佔的比例。兩者相關卻不相同——而在它們之間換算,是這整個學習階梯中最有用的一招。
- 數出每種基因型的個體數:nAA、nAa、naa。總數為 N。
- 每個 AA 貢獻兩個 A 等位基因;每個 Aa 貢獻一個 A 和一個 a;每個 aa 貢獻兩個 a。
- A 的頻率(記作 p)=(2·nAA + nAa)÷(2·N)。a 的頻率(記作 q)=(2·naa + nAa)÷(2·N)。
- 檢驗:p + q 應當等於 1,因為每個拷貝不是 A 就是 a。
Sampled population, one locus, two alleles A and a Genotype counts: AA = 36 individuals Aa = 48 individuals aa = 16 individuals N = 100 individuals → 2N = 200 allele copies Genotype frequencies: AA = 36/100 = 0.36 Aa = 48/100 = 0.48 aa = 16/100 = 0.16 Allele frequencies: count of A = (2*36) + 48 = 72 + 48 = 120 count of a = (2*16) + 48 = 32 + 48 = 80 p = freq(A) = 120/200 = 0.60 q = freq(a) = 80/200 = 0.40 check: p + q = 0.60 + 0.40 = 1.00 OK
為什麼用頻率而不是用計數
頻率讓你能夠比較大小不同的群體,並在固定的 0 到 1 的尺度上追蹤隨時間的變化。當某個多態性存在時——即一個基因座上有兩個或更多常見等位基因——有趣的問題永遠是這些頻率如何移動。本學習階梯接下來的部分,就是一趟巡覽那些推動頻率移動之力量的旅程。