为何要把死亡率装进一条公式?
到此为止,你已有两种方式来描述一条生命如何凋零。[[life-table|生命表]]是经验性的那种——一长列数字,每个整数年龄对应一个存活人数,直接从数据上读出。[[force-of-mortality|死亡力]]是平滑的那种——每一个确切瞬间的瞬时死亡速率,正是这个量,穿过生存—密度—风险关系,生成了整条[[survival-function|生存函数]]。而*死亡率法则*,便是二者的联姻:一条简洁的死亡力公式,一经选定,就能复现出整条生存曲线。
既然生命表已经握有真相,又何必费这个事?有三个理由。公式是*可携带*的——在一道教科书习题里,几个常数能随身而行,而一张千行的表格做不到。它是*平滑*的,于是它能在任何年龄给你一个答案,包括表格各级之间的那些分数年龄,无需任何额外假设。而且它*透明*:当你能看见死亡率沿着一条干净的指数曲线攀升,你便以一种满墙数字永远揭示不出的方式,理解了人类死亡的形状。代价是诚实——没有哪条整齐的曲线能完美贴合真实数据,所以法则是一种刻意的简化,从来不是事实。
四条经典法则:从玩具到可信
[[analytic-mortality-laws|解析死亡率法则]]这一家族,从可爱的粗糙一路延伸到真正堪用。最简单的是棣莫弗法则(De Moivre,1729):假设死亡在直到某个极限年龄 ω(比方说 100 岁)之前*完全均匀地*散布于各年龄。于是存活人数沿一条直线下降,死亡力为 1 ÷ (ω − x)——平缓上升,只在最末端才暴涨。它是个玩具:真实的死亡并不均匀。但它积分起来出奇地容易,因而在最初的练习与快速的合理性检验里自有其用武之地。
接下来是常数死亡力:假设死亡力在每个年龄上都是同一个数 μ。这使得未来寿命成为一个指数变量——就是那个著名的*无记忆*变量,在它眼里,一个 20 岁的人和一个 80 岁的人,明年死去的机会完全相同。对人类而言这显然不成立,因为人的风险随年龄攀升;可它仍是一段死亡率几乎不动的短窗口里最自然的基准,而且我们将会看到,它还兼任分数年龄假设之一。它的生存曲线按 e 的(−μ 乘以 t)次方衰减。
迈向真实感的一跃,来自冈珀茨(Gompertz,1825),他注意到一件深刻的事:在成年生命的大部分时段里,死亡力呈*几何级数*增长——它每年都乘以一个固定的倍数。把它写成 μ(x) = B·c^x,其中 c 略大于 1。这一条指数曲线,捕捉到了人类衰老的核心真相:从三十几岁起,你的死亡风险大约每八年左右便翻一番。随后梅克汉姆(Makeham,1860)加上了一个常数:μ(x) = A + B·c^x。多出来的 A 是一道与年龄无关的地板——意外、感染、纯粹的厄运,无论老少同样会降临——它让公式对真实数据的拟合明显变好,尤其在年轻年龄段,那里纯指数曲线压得太低了。
把它们并排摆开,这四条便是一列递进的死亡力公式,每一条都以多一分代数,换来多一分真实。棣莫弗用 1 ÷ (ω − x),对应直到年龄 ω 的均匀死亡。常数死亡力用一个平直的 μ,对年龄无记忆。冈珀茨用 B·c^x,把衰老刻画为一条干净的指数。梅克汉姆用 A + B·c^x——即冈珀茨再加上那道意外地板 A。请注意,常数死亡力不过是把 c 取作恰好等于 1(即不衰老)的冈珀茨,而棣莫弗则是个异类,它建立在均匀死亡之上,而非一个相乘的死亡力之上。对真实的成年人类死亡率而言,该伸手去取的,是冈珀茨—梅克汉姆这一对。
法则能买到什么——又买不到什么
回报是杠杆。由于法则在每一处都给出死亡力,你只需积分一次便得到生存函数,再由此导出你需要的每一个概率——存活任意时段的机会、[[future-lifetime-random-variable|未来寿命随机变量]]的分布、作为一个干净积分(而非一长串求和)的[[life-expectancy|预期寿命]]。比如在常数死亡力下,未来寿命的完全期望值就干脆是 1 ÷ μ:死亡力为 0.02,便意味着平均剩余寿命为 50 年,无需任何表格。这类闭式答案在考场上是真金,在任何地方都是磨砺直觉的利器。
在各级之间:分数年龄假设
现在来看日常的难题。生命表告诉你一个 60 岁的人活到 61 岁的机会,但一张保单可能在*未来六个月内*身故时赔付,或者一笔保费可能在 60 岁零三分之一岁时到期。在整数年龄之间,表格是沉默的。[[fractional-age-assumptions|分数年龄假设]]就是我们为做插值而采纳的规则——只用夹住某个年龄的那两个表值,就为每一岁年龄之内的死亡率,发明出一个站得住脚的形状。这里有两匹主力,而它们之间的差别,恰恰就是上文两条法则之间的差别,只不过是逐年地施加。
第一种是死亡均匀分布(UDD):在每一岁年龄之内,假设死亡均匀地散布于十二个月——这正是棣莫弗法则,缩小到单独一年的范围。它使得在该年内一个分数 t 的时段里死去的概率,简单地等于 t 乘以整年的死亡概率:一个 60 岁的人在头半年里死去的机会,就恰好是整年死去机会的一半。UDD 之所以最受欢迎,正因为它用起来如此简便,而且它在整数年龄之间,把存活人数列做线性插值。
第二种是每一岁年龄之内的常数死亡力:在整数年龄之间令 μ 保持平直——这正是常数死亡力法则,缩小到单独一年的范围。在此,存活人数在该年内呈指数衰减,而非线性衰减,于是半年的存活概率是整年存活概率的平方根。对寻常年龄那些小小的概率而言,两种假设给出的答案通常只在毫厘之间;唯有当死亡率很高、或你把一年切得极细时,它们才会分道扬镳。还有一处微妙却真实的对照:在 UDD 之下,死亡力在每一年里其实是*悄悄上爬*的,而常数死亡力按定义则把它牢牢压平。
半年时光,两种算法
把它落到实处。假设表上说一个 60 岁的人活不到 61 岁的机会是 0.01——于是一年的存活概率是 0.99。那么,在头*半*年里死去的机会是多少?在 UDD 之下,它是年率的一半:0.5 × 0.01 = 0.005。在常数死亡力之下,半年的存活概率是 √0.99 ≈ 0.99499,于是死亡概率约为 0.00501。两个答案在小数点后第五位才分出高下。这道毫厘之差,正是分数年龄假设的全部故事:一个真实存在、却通常微不足道的选择,唯有当你凑近放大时才显出形迹。
Table fact: q_60 = 0.01 (so p_60 = 0.99)
Half-year death probability, 0.5 * q_60 :
UDD : 0.5 * 0.01 = 0.00500
Constant force : 1 - sqrt(0.99) = 0.00501
^ differ in the 5th decimal