一个目标朴素的古老想法
上一篇给你留下了一行干净的式子——信度加权估计,自身数据乘以 Z 加上基准乘以(1 减 Z)——以及一个挥之不去的问题:权重 Z 究竟从何而来?本篇给出历史上的第一个答案。诞生于约 1914 年工伤补偿费率厘定中的有限波动信度(又称*经典*信度),是这门行业最早一次试图用规则、而非凭直觉来钉死 Z 的尝试。
它的目标刻意地朴素,而正是这份朴素,是理解后续一切的钥匙。它并不试图找出*最精确*的估计,它只对你自身的数据提一个要求:别让估计值在各期之间跳动得太厉害。它的名字已经把话挑明——我们想*限制*所报数字的*波动*。其中的道理很人性、也很容易向监管者辩护:一笔每年都上蹿下跳的保费,既不公平、又难以解释,而且多半反映的是运气而非信号。所以规则大致是:“在不让随机噪声把答案甩来甩去的前提下,尽量信任你自身的经验。”
完全信度:多少数据才配得上完全信任
从容易的一端讲起。假设你自身的数据多到噪声几乎消失殆尽——估计值几乎不再摆动。那你大可令 Z = 1,丢开基准,直接报出自己的数字。你愿意这么做时所需的数据量,就是完全信度标准。它是你必须跨过的门槛;一旦跨过,你的数据便“完全可信”。
这道门槛从何而来?来自你事先做出的两个选择,外加你已经认识的中心极限定理。第一,一个*容差*:你希望观测到的经验落在其真实均值多近的范围内——比如正负 5% 以内?第二,一个*概率*:你希望有多大频率达到这种接近——比如 90% 的时间?中心极限定理告诉你,许多相互独立观测的平均值近似正态,于是它把这两个选择换算成一个所需的样本量。对于服从泊松模式的理赔次数,要把频率估计到这般精度,需要约 (1.645 / 0.05) 的平方,算下来约为 1,082 次预期理赔。这个单一的数字——一千余次理赔——就是著名的、关于频率的经典完全信度标准。
Full-credibility standard for frequency (Poisson counts):
N_full = ( z_p / k )^2
z_p = normal score for the chosen probability p
k = chosen tolerance (relative)
'90% within +/- 5%' : z_p = 1.645, k = 0.05
N_full = (1.645 / 0.05)^2 = (32.9)^2 ~= 1,082 expected claims
Demand more -> bar climbs fast:
'99% within +/- 1%' : N_full = (2.576 / 0.01)^2 ~= 66,400 claims两条诚实的脚注。第一,那个 1,082 *只*管频率——如果每笔理赔的*金额*也在变动(它总是在变),标准会上调以容纳那份额外噪声,常常上调得不少。第二,也更要紧的是,这里没有一样东西是自然法则。把容差从 5% 改成 2.5%,或把置信度从 90% 改成 95%,门槛就会移动。完全信度标准是一种被选定的约定——有时获监管认可——而非关于世界的事实。两位审慎的精算师,可以为同一组业务各自言之成理地选出不同的标准。
部分信度与平方根法则
正是这个隐患,让信度成为一门每日的手艺,而非一桩奇谈:现实中几乎没有哪本业务真能攒够一千余次理赔。一个车险地区、一家中型雇主的团体计划、一款进入第三年的新产品——它们统统不够。不够,就意味着你的数据一文不值、必须彻底向基准缴械吗?当然不是。在门槛之下,你赢得部分信度:一个严格介于 0 与 1 之间的分数权重 Z,并随你数据的增长而增长。
经典信度用那条著名的平方根法则来设定这个分数权重:Z 等于(你实际拥有的数据,除以你达到完全信度所需的数据)的平方根,上限为 1。平方根正是其精髓所在——也常令初学者吃惊。如果你只有所需数据的*四分之一*,你的 Z 并不是四分之一;它是四分之一的平方根,也就是*二分之一*。权重沿一条曲线增长,而非直线,起初陡升,临近完全信度时再渐渐放平。
为什么是平方根,而不是更简单的东西?因为平均值的随机误差按样本量的平方根成比例缩小——正是你在大数定律那里遇到的同一条平方根定律。要把噪声*减半*,你需要*四倍*的数据。所以如果你按数据之比的平方根来设定 Z,部分可信估计里剩下的那点摆动,便恰好满足完全信度所分毫不差满足的那同一个安全目标。这条法则不是随意凑出来的拟合;它是那个波动目标,被一以贯之地带到了完全信度门槛之下。
一个完整走通的例子
设想某车险公司的一个小地区。它有史以来产生了 270 次理赔;这个险种的完全信度标准是 1,082。它自身的数据说每辆车的损失成本是 850;而全国基准——它将朝之混合的那个*信度补集*——是 1,000。我们已经握有设定 Z、报出费率所需的一切。一步步走一遍。
- 把你的数据与门槛相比:你有 270 次理赔,而完全信度标准是 1,082,比值约为 0.25——走了四分之一的路。
- 套用平方根法则:Z = sqrt(270 / 1,082) = sqrt(0.25),约为 0.50。数据只有四分之一,权重却有一半。
- 用信度加权公式混合:费率 = 0.50 × 850 + 0.50 × 1,000 = 925,干净利落地落在你自身成本与基准之间。
留意一下:一旦握住 Z,算术是多么平淡无奇——整个信度因子 Z只在一次乘法里就把活干完了。现在看那条平方根曲线如何咬人。要把这个地区的 Z 从 0.50 推高到体面的 0.75,你需要的不是多出 50% 的数据;你需要把它*翻一倍有余*,到约 608 次理赔,因为 0.75 的平方乘以 1,082 约等于 608。而要够到完全信度,你得攒满全部 1,082——把当下的证据翻四倍,才能让起初的权重翻一倍。信度是慢慢挣来的,而且越接近,挣得越慢。
它的魅力——以及那个不容回避的盲点
经典信度何以历经一个世纪而不衰,不难看出。它*透明*:监管者或保单持有人能跟上每一步。它*省事*:两个判断取舍加一个平方根,不需要繁重的估计。它*站得住脚*:“一旦你的数据稳定到十年里有九年都落在真值的 5% 以内,我们就信任它”——这是任何人都能领会的一句话。它至今仍嵌在世界各地的费率手册与监管公式里,而对许多业务而言,它就是够用了。
可现在,是这门行业欠自己的那份诚实了。把我们做过的一切回头读一遍,留意一样自始至终不曾露面的东西:任何衡量*这个地区与全国平均究竟有多不同*的尺度。经典信度只向内看,盯着你自身数据里的噪声,并把基准当成对你而言恰好正确、可供退守的东西。它从不追问那个全国的 1,000 是否哪怕接近这个地区的真实成本。Z 完全由*你自身经验的方差*构成——从不取决于风险之间真实的离散。
那唯一缺失的成分——一把衡量风险间真实差异的尺子——正是下一篇要补上的。Bühlmann 信度把风险*内部*的噪声,与风险*之间*真实的离散相互权衡,并从这份权衡里导出一个 Z,它的目标不只是限制波动,而是尽可能精确。经典信度是那份诚实、直观的初稿;Bühlmann 则是有原则的修订。你正是要先有了前者,才能真正欣赏后者。