从一个家庭到整个群体
经典的孟德尔遗传学在一个家庭内追踪等位基因——从父母到后代。群体遗传学则把视角彻底拉远:它把整个可互相交配的群体当作一个单位,去问每个等位基因有多常见,以及这种常见程度是否会随世代改变。
核心的抽象概念是基因库:想象把某个基因座上每个个体携带的所有等位基因都倒进同一个袋子里。一个由 100 个个体组成的二倍体群体,在每个基因座上携带 200 个等位基因。一个等位基因的频率,就是它在这个袋子里所占的份额——一个介于 0 和 1 之间的数。
基因型频率 vs. 等位基因频率
你可以数两样东西。基因型频率是带有各种基因型(AA、Aa、aa)的个体所占的比例。等位基因频率是基因库中各等位基因拷贝(A 与 a)所占的比例。两者相关却不相同——而在它们之间换算,是这整个学习阶梯中最有用的一招。
- 数出每种基因型的个体数:nAA、nAa、naa。总数为 N。
- 每个 AA 贡献两个 A 等位基因;每个 Aa 贡献一个 A 和一个 a;每个 aa 贡献两个 a。
- A 的频率(记作 p)=(2·nAA + nAa)÷(2·N)。a 的频率(记作 q)=(2·naa + nAa)÷(2·N)。
- 检验:p + q 应当等于 1,因为每个拷贝不是 A 就是 a。
Sampled population, one locus, two alleles A and a Genotype counts: AA = 36 individuals Aa = 48 individuals aa = 16 individuals N = 100 individuals → 2N = 200 allele copies Genotype frequencies: AA = 36/100 = 0.36 Aa = 48/100 = 0.48 aa = 16/100 = 0.16 Allele frequencies: count of A = (2*36) + 48 = 72 + 48 = 120 count of a = (2*16) + 48 = 32 + 48 = 80 p = freq(A) = 120/200 = 0.60 q = freq(a) = 80/200 = 0.40 check: p + q = 0.60 + 0.40 = 1.00 OK
为什么用频率而不是用计数
频率让你能够比较大小不同的群体,并在固定的 0 到 1 的尺度上追踪随时间的变化。当某个多态性存在时——即一个基因座上有两个或更多常见等位基因——有趣的问题永远是这些频率如何移动。本学习阶梯接下来的部分,就是一趟巡览那些推动频率移动之力量的旅程。