最大精度（Bühlmann）信度

从经验法则到第一性原理

在上一篇里你认识了有限波动信度：你先定一个完全信度标准——比如 1,082 次理赔——低于这个数，你就用一个权重 Z 把自己的经验和手册费率掺在一起。它管用，整整一个世纪这活儿就是这么干的。但要诚实地看清它的本质：它是一份配方。它回答的是「我需要多少数据，随机噪声才小到可以接受？」它从不追问那个更深的问题——*我想要分辨的这些风险，彼此之间究竟有多不一样？* 如果我账上每个司机其实都一模一样，那么再多他自己的数据也告诉不了我关于他的任何新东西，我就该完全倚重平均值。如果司机们千差万别，那么哪怕一点点他自己的数据都弥足珍贵。

最大精度信度——通常称为 Bühlmann 信度，得名于 Hans Bühlmann 1967 年的论文——把那个更深的问题当真了。它不从噪声容忍度出发，而是从一个目标出发：找到「你自己的数据」与「整体平均」之间的某种加权混合，使其平均而言最接近真相——也就是让期望平方误差最小。结果发现，最好的*线性*答案有一个惊人干净的形式，而其中每一个量都是你真能从数据里估出来的。没有什么从表里搬来的神秘数字 1,082；权重是从风险本身的结构里长出来的。

藏在数据里的两种方差

整台引擎都建立在一次看见之上：当你盯着来自许多不同风险的一堆数字时，你观察到的那份离散，其实是*两样*截然不同的东西混在一起的结果。想象一百家餐厅，每家都报了好几年的火灾理赔成本。这些数字上下跳动，有两个原因。第一，哪怕是固定的某一家餐厅，也有好年景和坏年景——纯粹是运气，是掷骰子。第二，这些餐厅本来就不一样：一家油炸为主的小馆，年复一年都比沙拉吧更危险。Bühlmann 的洞见，就是把这两样分别命名、分别度量，因为它们之间的*比值*，恰恰应当主宰你对某一家餐厅自身记录的信任程度。

第一块是过程方差的期望，即 EPV。固定单一风险——某一家餐厅，连同它自己真实的潜在出险率——然后问：它逐年的数字，*单单出于运气*会上下跳动多少？这种风险内部的抖动，就是过程方差。不同餐厅这份抖动的大小不一，于是我们对所有餐厅取期望：EPV 就是风险内部噪声的平均。EPV 高，意味着即便是一个已知的、固定的风险，也会产出剧烈摇摆的结果——它自己的数据大多是杂音，很难读懂。

第二块是假设均值的方差，即 VHM。设想你能神奇地知道每家餐厅*真实*的长期平均成本——它的假设均值，也就是经过无穷多年后它会稳定下来的那个数。这些真实均值并不都相等；油炸小馆的那个，确实比沙拉吧的更高。VHM 就是这些真实均值在整个总体上的方差。VHM 高，意味着这些风险彼此之间真的、深刻地不同——于是搞清楚你看的*是哪一个*关系重大，而它自己的数据值得一听。

公式，以及它为何读起来像一句话

现在是回报。定义一个数，即 Bühlmann k，等于两个方差之比：k = EPV / VHM。那么对一个你已观察了 n 期的风险，信度因子 Z 就是 Z = n / (n + k)。你的最终估计——信度保费——便是那个信度加权混合：Z 乘以你自己观察到的均值，加上 (1 − Z) 乘以总均值。这就是全部方法。三行，却扛起了一个世纪实践的全部分量。

k = EPV / VHM
Z = n / (n + k)
estimate = Z * (your own mean) + (1 - Z) * (grand mean)

完整的 Bühlmann 配方。k 是噪声与信号之比；随着你积累更多年份 n，Z 趋向于 1。

把 Z = n / (n + k) 慢慢念出来，它几乎会开口说话。k 的作用，像是你背上始终驮着的若干个「幽灵」年的平均经验。若 k = 4，那么紧挨着你那 n 个真实数据年的，是 4 个看不见的年份，它们悄悄地坚持要用总均值。若你自己有 n = 4 年，则 Z = 4 / 8 = 0.5——恰好打平，一半靠你的数据，一半靠平均。再多攒几年，你真实的证据就压过幽灵：n = 36 时 Z = 36 / 40 = 0.9。当 n 无限增长，Z 攀向 1，平均值随之淡出——这正合天理，因为有了足够多自己的数据，你便不再需要向别人借力了。

为何越同质的风险信度越高

这里是最值得带回家的一部分。因为 k = EPV / VHM，你赋予的信度，由噪声与信号之间的一场拉锯战所主宰。EPV 是单一风险内部的噪声；VHM 是风险之间真实差异的信号。当 VHM 大时——风险是异质的，彼此确实相距甚远——k 就小，于是 Z 大：你自己的数据获胜，因为分辨风险确实要紧，而你的记录确实能锁定你看的是哪一个。当 EPV 大时——每个风险的数字都狂野、由运气主导——k 就大，Z 小：你自己的数据大多是噪声，于是你退回到那个宽泛的平均。

现在那句标题式的论断——*越同质的风险信度越高*——需要小心措辞，因为「同质」可以指两件相反的事，而这里只有一件是对的。它绝不是指一个人人都一模一样的池子；在那种池子里 VHM 为零，于是 k 无穷大、Z 坍缩为零——你不该信任任何人的个体数据，因为根本没有什么个体的东西可学。真正赢得高信度的，是这样一个风险：它*内部*稳定而平顺——EPV 低，自己的数字平静且可重复——同时身处一个风险*彼此相异*的总体之中——VHM 高。内部稳、相互异：这才是甜蜜点，在那里，某一个风险自己那份安静而一致的记录便是黄金。

一个小小的算例，以及诚实的边界

我们给它配上数字。假设一项针对众多工厂账户的研究告诉你：总均值理赔成本为每年 500，EPV（账户内部的平均运气波动）为 90,000，VHM（账户之间的真实离散）为 30,000。那么 k = 90,000 / 30,000 = 3。你承保了 n = 6 年的某家工厂，平均每年 800——远高于全册水平。它的信度为 Z = 6 / (6 + 3) = 2/3。它的信度保费为 (2/3)(800) + (1/3)(500) = 533 + 167 = 700。你相信它那份糟糕记录的大部分、但非全部——你把它从平均值朝它自己的经验推了三分之二的路程。

两点诚实的提醒。第一，现实里没人会把 EPV 和 VHM 直接递到你手上——你必须从数据里*估计*它们，而这本身是一门手艺（无偏估计量，以及把 Bühlmann 推广到规模不等之风险的经验贝叶斯机制，是后面几篇的主题）。糟糕的方差估计甚至可能算出负数，那是无稽之谈，必须截断到零；对你的 k 要像对待任何估计一样心怀谦卑。第二，Bühlmann 是最佳*线性*法则，而非毫无保留的最佳法则。倘若你愿意假设一个完整的概率模型——一个关于风险的先验，加上一个关于数据的似然——那么完备的贝叶斯信度会给出真正最优的后验估计，而 Bühlmann 不过是它的那道直线投影。

即便有这些保留，这仍是那个让信度成为*理论*而非惯例的念头。有限波动用一个是与否的门槛回答了「我的数据够大吗？」。Bühlmann 回答的是那个更好的问题——「考虑到每个风险有多吵、风险之间又有多么不同，哪一种混合可被证明最接近真相？」——而它的答案，是一条简短、能自我检验、且精算师能在监管者面前为之辩护的公式。这正是为什么，当人们说信度是别处寻它不得的纯粹精算基因时，他们心里想的，正是这一段代码。