从经验法则到第一性原理
在上一篇里你认识了有限波动信度:你先定一个完全信度标准——比如 1,082 次理赔——低于这个数,你就用一个权重 Z 把自己的经验和手册费率掺在一起。它管用,整整一个世纪这活儿就是这么干的。但要诚实地看清它的本质:它是一份配方。它回答的是「我需要多少数据,随机噪声才小到可以接受?」它从不追问那个更深的问题——*我想要分辨的这些风险,彼此之间究竟有多不一样?* 如果我账上每个司机其实都一模一样,那么再多他自己的数据也告诉不了我关于他的任何新东西,我就该完全倚重平均值。如果司机们千差万别,那么哪怕一点点他自己的数据都弥足珍贵。
最大精度信度——通常称为 Bühlmann 信度,得名于 Hans Bühlmann 1967 年的论文——把那个更深的问题当真了。它不从噪声容忍度出发,而是从一个目标出发:找到「你自己的数据」与「整体平均」之间的某种加权混合,使其平均而言最接近真相——也就是让期望平方误差最小。结果发现,最好的*线性*答案有一个惊人干净的形式,而其中每一个量都是你真能从数据里估出来的。没有什么从表里搬来的神秘数字 1,082;权重是从风险本身的结构里长出来的。
藏在数据里的两种方差
整台引擎都建立在一次看见之上:当你盯着来自许多不同风险的一堆数字时,你观察到的那份离散,其实是*两样*截然不同的东西混在一起的结果。想象一百家餐厅,每家都报了好几年的火灾理赔成本。这些数字上下跳动,有两个原因。第一,哪怕是固定的某一家餐厅,也有好年景和坏年景——纯粹是运气,是掷骰子。第二,这些餐厅本来就不一样:一家油炸为主的小馆,年复一年都比沙拉吧更危险。Bühlmann 的洞见,就是把这两样分别命名、分别度量,因为它们之间的*比值*,恰恰应当主宰你对某一家餐厅自身记录的信任程度。
第一块是过程方差的期望,即 EPV。固定单一风险——某一家餐厅,连同它自己真实的潜在出险率——然后问:它逐年的数字,*单单出于运气*会上下跳动多少?这种风险内部的抖动,就是过程方差。不同餐厅这份抖动的大小不一,于是我们对所有餐厅取期望:EPV 就是风险内部噪声的平均。EPV 高,意味着即便是一个已知的、固定的风险,也会产出剧烈摇摆的结果——它自己的数据大多是杂音,很难读懂。
第二块是假设均值的方差,即 VHM。设想你能神奇地知道每家餐厅*真实*的长期平均成本——它的假设均值,也就是经过无穷多年后它会稳定下来的那个数。这些真实均值并不都相等;油炸小馆的那个,确实比沙拉吧的更高。VHM 就是这些真实均值在整个总体上的方差。VHM 高,意味着这些风险彼此之间真的、深刻地不同——于是搞清楚你看的*是哪一个*关系重大,而它自己的数据值得一听。
公式,以及它为何读起来像一句话
现在是回报。定义一个数,即 Bühlmann k,等于两个方差之比:k = EPV / VHM。那么对一个你已观察了 n 期的风险,信度因子 Z 就是 Z = n / (n + k)。你的最终估计——信度保费——便是那个信度加权混合:Z 乘以你自己观察到的均值,加上 (1 − Z) 乘以总均值。这就是全部方法。三行,却扛起了一个世纪实践的全部分量。
k = EPV / VHM Z = n / (n + k) estimate = Z * (your own mean) + (1 - Z) * (grand mean)
把 Z = n / (n + k) 慢慢念出来,它几乎会开口说话。k 的作用,像是你背上始终驮着的若干个「幽灵」年的平均经验。若 k = 4,那么紧挨着你那 n 个真实数据年的,是 4 个看不见的年份,它们悄悄地坚持要用总均值。若你自己有 n = 4 年,则 Z = 4 / 8 = 0.5——恰好打平,一半靠你的数据,一半靠平均。再多攒几年,你真实的证据就压过幽灵:n = 36 时 Z = 36 / 40 = 0.9。当 n 无限增长,Z 攀向 1,平均值随之淡出——这正合天理,因为有了足够多自己的数据,你便不再需要向别人借力了。
为何越同质的风险信度越高
这里是最值得带回家的一部分。因为 k = EPV / VHM,你赋予的信度,由噪声与信号之间的一场拉锯战所主宰。EPV 是单一风险内部的噪声;VHM 是风险之间真实差异的信号。当 VHM 大时——风险是异质的,彼此确实相距甚远——k 就小,于是 Z 大:你自己的数据获胜,因为分辨风险确实要紧,而你的记录确实能锁定你看的是哪一个。当 EPV 大时——每个风险的数字都狂野、由运气主导——k 就大,Z 小:你自己的数据大多是噪声,于是你退回到那个宽泛的平均。
现在那句标题式的论断——*越同质的风险信度越高*——需要小心措辞,因为「同质」可以指两件相反的事,而这里只有一件是对的。它绝不是指一个人人都一模一样的池子;在那种池子里 VHM 为零,于是 k 无穷大、Z 坍缩为零——你不该信任任何人的个体数据,因为根本没有什么个体的东西可学。真正赢得高信度的,是这样一个风险:它*内部*稳定而平顺——EPV 低,自己的数字平静且可重复——同时身处一个风险*彼此相异*的总体之中——VHM 高。内部稳、相互异:这才是甜蜜点,在那里,某一个风险自己那份安静而一致的记录便是黄金。
一个小小的算例,以及诚实的边界
我们给它配上数字。假设一项针对众多工厂账户的研究告诉你:总均值理赔成本为每年 500,EPV(账户内部的平均运气波动)为 90,000,VHM(账户之间的真实离散)为 30,000。那么 k = 90,000 / 30,000 = 3。你承保了 n = 6 年的某家工厂,平均每年 800——远高于全册水平。它的信度为 Z = 6 / (6 + 3) = 2/3。它的信度保费为 (2/3)(800) + (1/3)(500) = 533 + 167 = 700。你相信它那份糟糕记录的大部分、但非全部——你把它从平均值朝它自己的经验推了三分之二的路程。
两点诚实的提醒。第一,现实里没人会把 EPV 和 VHM 直接递到你手上——你必须从数据里*估计*它们,而这本身是一门手艺(无偏估计量,以及把 Bühlmann 推广到规模不等之风险的经验贝叶斯机制,是后面几篇的主题)。糟糕的方差估计甚至可能算出负数,那是无稽之谈,必须截断到零;对你的 k 要像对待任何估计一样心怀谦卑。第二,Bühlmann 是最佳*线性*法则,而非毫无保留的最佳法则。倘若你愿意假设一个完整的概率模型——一个关于风险的先验,加上一个关于数据的似然——那么完备的贝叶斯信度会给出真正最优的后验估计,而 Bühlmann 不过是它的那道直线投影。
即便有这些保留,这仍是那个让信度成为*理论*而非惯例的念头。有限波动用一个是与否的门槛回答了「我的数据够大吗?」。Bühlmann 回答的是那个更好的问题——「考虑到每个风险有多吵、风险之间又有多么不同,哪一种混合可被证明最接近真相?」——而它的答案,是一条简短、能自我检验、且精算师能在监管者面前为之辩护的公式。这正是为什么,当人们说信度是别处寻它不得的纯粹精算基因时,他们心里想的,正是这一段代码。