有限波动（经典）信度

一个目标朴素的古老想法

上一篇给你留下了一行干净的式子——信度加权估计，自身数据乘以 Z 加上基准乘以（1 减 Z）——以及一个挥之不去的问题：权重 Z 究竟从何而来？本篇给出历史上的第一个答案。诞生于约 1914 年工伤补偿费率厘定中的有限波动信度（又称*经典*信度），是这门行业最早一次试图用规则、而非凭直觉来钉死 Z 的尝试。

它的目标刻意地朴素，而正是这份朴素，是理解后续一切的钥匙。它并不试图找出*最精确*的估计，它只对你自身的数据提一个要求：别让估计值在各期之间跳动得太厉害。它的名字已经把话挑明——我们想*限制*所报数字的*波动*。其中的道理很人性、也很容易向监管者辩护：一笔每年都上蹿下跳的保费，既不公平、又难以解释，而且多半反映的是运气而非信号。所以规则大致是：“在不让随机噪声把答案甩来甩去的前提下，尽量信任你自身的经验。”

完全信度：多少数据才配得上完全信任

从容易的一端讲起。假设你自身的数据多到噪声几乎消失殆尽——估计值几乎不再摆动。那你大可令 Z = 1，丢开基准，直接报出自己的数字。你愿意这么做时所需的数据量，就是完全信度标准。它是你必须跨过的门槛；一旦跨过，你的数据便“完全可信”。

这道门槛从何而来？来自你事先做出的两个选择，外加你已经认识的中心极限定理。第一，一个*容差*：你希望观测到的经验落在其真实均值多近的范围内——比如正负 5% 以内？第二，一个*概率*：你希望有多大频率达到这种接近——比如 90% 的时间？中心极限定理告诉你，许多相互独立观测的平均值近似正态，于是它把这两个选择换算成一个所需的样本量。对于服从泊松模式的理赔次数，要把频率估计到这般精度，需要约 (1.645 / 0.05) 的平方，算下来约为 1,082 次预期理赔。这个单一的数字——一千余次理赔——就是著名的、关于频率的经典完全信度标准。

Full-credibility standard for frequency (Poisson counts):

  N_full = ( z_p / k )^2
     z_p = normal score for the chosen probability p
     k   = chosen tolerance (relative)

  '90% within +/- 5%' :  z_p = 1.645,  k = 0.05
     N_full = (1.645 / 0.05)^2 = (32.9)^2  ~= 1,082 expected claims

  Demand more -> bar climbs fast:
  '99% within +/- 1%' :  N_full = (2.576 / 0.01)^2 ~= 66,400 claims

这个标准不过是把两个判断取舍放进正态曲线里跑一遍。更紧的容差或更高的置信度会让它急剧膨胀——注意它从约 1,082 跃升到约 66,400。

两条诚实的脚注。第一，那个 1,082 *只*管频率——如果每笔理赔的*金额*也在变动（它总是在变），标准会上调以容纳那份额外噪声，常常上调得不少。第二，也更要紧的是，这里没有一样东西是自然法则。把容差从 5% 改成 2.5%，或把置信度从 90% 改成 95%，门槛就会移动。完全信度标准是一种被选定的约定——有时获监管认可——而非关于世界的事实。两位审慎的精算师，可以为同一组业务各自言之成理地选出不同的标准。

部分信度与平方根法则

正是这个隐患，让信度成为一门每日的手艺，而非一桩奇谈：现实中几乎没有哪本业务真能攒够一千余次理赔。一个车险地区、一家中型雇主的团体计划、一款进入第三年的新产品——它们统统不够。不够，就意味着你的数据一文不值、必须彻底向基准缴械吗？当然不是。在门槛之下，你赢得部分信度：一个严格介于 0 与 1 之间的分数权重 Z，并随你数据的增长而增长。

经典信度用那条著名的平方根法则来设定这个分数权重：Z 等于（你实际拥有的数据，除以你达到完全信度所需的数据）的平方根，上限为 1。平方根正是其精髓所在——也常令初学者吃惊。如果你只有所需数据的*四分之一*，你的 Z 并不是四分之一；它是四分之一的平方根，也就是*二分之一*。权重沿一条曲线增长，而非直线，起初陡升，临近完全信度时再渐渐放平。

为什么是平方根，而不是更简单的东西？因为平均值的随机误差按样本量的平方根成比例缩小——正是你在大数定律那里遇到的同一条平方根定律。要把噪声*减半*，你需要*四倍*的数据。所以如果你按数据之比的平方根来设定 Z，部分可信估计里剩下的那点摆动，便恰好满足完全信度所分毫不差满足的那同一个安全目标。这条法则不是随意凑出来的拟合；它是那个波动目标，被一以贯之地带到了完全信度门槛之下。

一个完整走通的例子

设想某车险公司的一个小地区。它有史以来产生了 270 次理赔；这个险种的完全信度标准是 1,082。它自身的数据说每辆车的损失成本是 850；而全国基准——它将朝之混合的那个*信度补集*——是 1,000。我们已经握有设定 Z、报出费率所需的一切。一步步走一遍。

把你的数据与门槛相比：你有 270 次理赔，而完全信度标准是 1,082，比值约为 0.25——走了四分之一的路。
套用平方根法则：Z = sqrt(270 / 1,082) = sqrt(0.25)，约为 0.50。数据只有四分之一，权重却有一半。
用信度加权公式混合：费率 = 0.50 × 850 + 0.50 × 1,000 = 925，干净利落地落在你自身成本与基准之间。

留意一下：一旦握住 Z，算术是多么平淡无奇——整个信度因子 Z只在一次乘法里就把活干完了。现在看那条平方根曲线如何咬人。要把这个地区的 Z 从 0.50 推高到体面的 0.75，你需要的不是多出 50% 的数据；你需要把它*翻一倍有余*，到约 608 次理赔，因为 0.75 的平方乘以 1,082 约等于 608。而要够到完全信度，你得攒满全部 1,082——把当下的证据翻四倍，才能让起初的权重翻一倍。信度是慢慢挣来的，而且越接近，挣得越慢。

它的魅力——以及那个不容回避的盲点

经典信度何以历经一个世纪而不衰，不难看出。它*透明*：监管者或保单持有人能跟上每一步。它*省事*：两个判断取舍加一个平方根，不需要繁重的估计。它*站得住脚*：“一旦你的数据稳定到十年里有九年都落在真值的 5% 以内，我们就信任它”——这是任何人都能领会的一句话。它至今仍嵌在世界各地的费率手册与监管公式里，而对许多业务而言，它就是够用了。

可现在，是这门行业欠自己的那份诚实了。把我们做过的一切回头读一遍，留意一样自始至终不曾露面的东西：任何衡量*这个地区与全国平均究竟有多不同*的尺度。经典信度只向内看，盯着你自身数据里的噪声，并把基准当成对你而言恰好正确、可供退守的东西。它从不追问那个全国的 1,000 是否哪怕接近这个地区的真实成本。Z 完全由*你自身经验的方差*构成——从不取决于风险之间真实的离散。

那唯一缺失的成分——一把衡量风险间真实差异的尺子——正是下一篇要补上的。Bühlmann 信度把风险*内部*的噪声，与风险*之间*真实的离散相互权衡，并从这份权衡里导出一个 Z，它的目标不只是限制波动，而是尽可能精确。经典信度是那份诚实、直观的初稿；Bühlmann 则是有原则的修订。你正是要先有了前者，才能真正欣赏后者。