核心思想:一个不变化的群体
1908 年,一位数学家(G. H. Hardy)和一位医生(Wilhelm Weinberg)各自独立地证明了一件令人安心的事:在一个大的、随机交配的群体中,只要没有突变、没有迁移、没有选择、也没有漂变,等位基因频率就不会自行偏移。哈迪–温伯格平衡就是“静止的物体保持静止”在遗传学上的版本。
在这些条件下有两件事成立。第一,等位基因频率 p 和 q 一代一代保持恒定。第二,经过一代随机交配后,基因型频率会稳定为一个固定的模式:AA = p²,Aa = 2pq,aa = q²。
Why p^2 + 2pq + q^2 ? Random mating = drawing two alleles at random
Egg carries A with prob p, a with prob q
Sperm carries A with prob p, a with prob q
sperm A (p) sperm a (q)
egg A (p) | AA = p*p = p^2 | Aa = p*q |
egg a (q) | Aa = q*p | aa = q*q = q^2 |
Sum the offspring genotypes:
AA = p^2
Aa = p*q + q*p = 2pq
aa = q^2
Total: p^2 + 2pq + q^2 = (p + q)^2 = 1^2 = 1应用:携带者频率的小技巧
这个公式在隐性性状上最能体现价值。如果你只知道 aa 表型出现的频率,哈迪–温伯格平衡就能让你估算出隐藏的携带者(Aa)——那些携带一个拷贝但不表现该性状的人。
- 从隐性表型频率出发:q² = freq(aa)。
- 开平方得到 q,即隐性等位基因频率。
- 求出 p = 1 − q。
- 携带者频率 = 2pq。把它与患者频率 q² 比较——携带者通常远比患者常见。
A recessive condition affects 1 in 2500 people. q^2 = freq(affected) = 1/2500 = 0.0004 q = sqrt(0.0004) = 0.02 p = 1 - q = 0.98 Carriers (Aa) = 2pq = 2 * 0.98 * 0.02 = 0.0392 ≈ 1 in 25 Affected (aa) = q^2 = 0.0004 = 1 in 2500 So ~100 carriers exist for every affected person. (Educational illustration of the math — not medical advice.)
它真正的用途:零假设
没有任何真实群体能完美满足所有假设——那为什么还要费这个劲?因为哈迪–温伯格是一个零模型。它告诉你:如果什么有趣的事都没发生,你应该看到怎样的基因型频率。当真实计数偏离 p²、2pq、q² 时,这种偏离本身就是一个信号:也许是选择,也许是非随机交配,也许是小群体中的漂变。这个平衡之所以有价值,恰恰因为它告诉你何时该深入探查。