这部机器的另一半
损失机器的一半你已经搭好了:在频率—严重度分解里,你把一批业务的成本拆成了*来多少次*理赔,以及*每次有多大*。本级前面几篇钉牢了频率这一侧——泊松与负二项这两个计数模型。这一篇转向另一半,也就是严重度:既然理赔已经发生,它要花掉多少美元?为这件事建模,正是理赔严重度分布的活儿——一个住在正数上的连续分布。
为什么非要给严重度建模——直接把过去的理赔平均一下不就完了吗?因为单凭平均值,会把那些足以让保险公司送命的东西藏起来。两批业务可以共有同一个平均理赔 4000 美元,可一批是源源不断的 4000 美元小擦碰,另一批却是一千笔 500 美元的刮蹭加上偶尔一桩 200 万美元的官司。平均值对得上;可它们的*形状*天差地别,而真正威胁偿付能力的只有其中一个。严重度分布捕捉的正是这整个形状——质量堆在哪里、右臂伸出多远,以及单单一笔理赔可能为自己攫走明年总额的多大一块。
严重度分布的角色阵容
当初你头一回逛精算工具箱时就见过这几个家族;这里我们让它们作为同一份工作的竞争者上场干活。指数分布是最简单的诚实初稿——单参数、恒定衰减,以及那条*无记忆*性质:损失再长 1000 美元的概率,无论它已经多大都不变。作为第一手猜测它不赖,但真实理赔数据几乎总是想要比它那一个旋钮更多的灵活度。
伽马分布添了一个形状参数,于是曲线可以先隆起一个峰、再回落——适合那些围着某个典型金额扎堆的中等理赔。威布尔分布有自己的形状旋钮,专管尾巴的脾性:往一边拧,尾巴又轻又规矩;往另一边拧,它就拉长开来——这正是工程师拿它来刻画失效与磨损寿命的缘故。对数正态分布讲的是一个*乘法*的故事——一笔由许多随机因子相乘而成的损失(一次维修取决于零件 × 工时 × 延误 × 撞击的猛烈程度),它的对数服从正态,整体呈现强烈的右偏,而这副形状恰能贴合出乎意料多的真实理赔数据。
然后就是帕累托分布,它自成一类,整个最后一节都留给它。眼下,先按尾部的轻重把其余几个排个队,从最轻到最重:指数和伽马衰减得快,对数正态拖得更远,威布尔能轻能重,而帕累托则拒绝消退。在它们之间取舍并不是一场选美——它是一场关于*最大*那些损失会如何表现的赌注,而那些损失恰恰是你手上数据最少的。
拟合一个严重度分布
选定一个家族只是工作的一半;你还得给它选定参数,让曲线真正贴合你的理赔。这就是损失分布拟合,它沿用你早先学过的那套估计思想,如今对准了赔付金额。最快的路子是矩估计法:算出过去理赔的样本均值与方差,再挑出能复现它们的参数。它快,能给一个像样的起点,但它倚仗的是低阶矩,于是几乎不理会尾部——而对严重度而言,钱恰恰就在那条尾巴上。
真正的主力则是极大似然估计:选那组参数,使你实际观察到的理赔最有可能出现。它用上每一个数据点,附带标准误让你知道每个估计有多飘,而且——这对保险至关重要——它可以写成尊重*删失*与*截断*数据的形式。这一点要紧,因为原始理赔数据极少是干净的:一道保单限额会给你能看到的金额封顶(在 100 万美元保单上发生的 300 万美元损失,账面上恰恰记成 100 万美元),而免赔额则截掉了那些根本没人来报的小额理赔。一个无视这些扭曲的拟合,会把尾部判断得离谱。
在候选者之间作出抉择
假设你把三个候选者——比如伽马、对数正态和帕累托——拟合到了同一批理赔上。你信哪一个?大致按下面这个次序,从三个方面去评判它们。
- 故事对得上吗?在任何算术之前,先问这个分布背后的故事是否契合这项风险。乘法式的损害指向对数正态;少数巨灾理赔混在众多小额之中则指向帕累托。一个故事讲错了的模型,即便数字看上去漂亮,也会把你引入歧途。
- 拟合有多好,又是否对复杂度做了诚实的惩罚?跑一遍拟合优度检验,把候选者们放在一起比。参数越多的分布,总能把数据贴得越紧,所以既要奖赏拟合、又要惩罚多余的参数——否则你奖赏的就只是过拟合的噪声,而非抓住真正的形状。
- 尾部贴合得如何——又有多稳?把目光最狠地盯在那些最大的理赔上,因为正是在那里,对躯干意见一致的候选者们分歧最大。然后换上略微不同的数据(或者干脆抽掉单笔最大的理赔)重新拟合,看看答案挪动了多少。若它一下子蹿动,说明你的尾部估计很脆,那就该往保守那边靠。
留意榜单上*没有*的那一条:"中段误差最小的那个"。两个分布可以在普通理赔的主体部分几乎严丝合缝,所推出的尾部概率却能相差十倍。给一个高保单限额或一层再保险定价时,那些尾部概率就是问题的全部。挑选严重度模型,是为了画面里你几乎看不见的那一截——这恰恰说明,在此处,对其不确定性保持诚实,比在精算工作几乎任何其他地方都更要紧。
重尾:当一笔理赔就是整整一年
现在来到了关键。重尾意味着一笔巨额损失的概率消退得*很慢*——它按损失大小的某个幂次衰减,而不是按指数衰减。最干净的例子是帕累托严重度:把损失门槛翻一倍,超过它的概率只按一个固定的比例下降,无论你已经爬到多高都一样。其实践后果令人吃惊。在轻尾之下,你那一百笔普通理赔和那一笔大理赔,大体落在同一个金额量级里。而在重尾之下,一年里单笔最大的理赔,可能比其余所有理赔之和还要大。
这正是巨灾险与责任险所在的世界——地震、飓风、大规模侵权官司、流行病理赔。重尾打碎了你一直倚仗的那些舒适直觉。样本平均值收敛得*慢得叫人发疼*,因为它老在等下一笔会把它猛地往上拽的离奇损失,于是十个风平浪静的年头告诉你的,远比看上去要少。在最极端的重尾情形里,数学上的方差、甚至连均值本身,都是*无穷大*的——这意味着再多过去的数据也钉不住那个平均值,而你早先见过的那幅令人安心的中心极限图景,在这里压根儿不适用。
Pareto tail: P(loss > x) ~ (b / x)^a (a = tail index) P(loss > $1,000,000) = 0.0100 P(loss > $2,000,000) = 0.0050 (halve again per doubling, a=1) P(loss > $4,000,000) = 0.0025 Light (exponential) tail for contrast: P(loss > $1,000,000) = 0.0100 P(loss > $2,000,000) = 0.0001 (vanishes far faster)
所以,对尾部要怀着谦卑。因为轻尾贴合了日常理赔、又显得整洁就选它,正是通向破产的经典路径之一:保险公司在太平年景里入账可观的利润,随后一桩它从未定价的尾部事件登场,把十年的盈余一笔抹平。这也正是为什么对尾部敏感的风险度量如此要紧——像尾部风险价值这样的度量,看的是越过某个门槛之后损失的*平均*大小,捕捉到了尾部的深度,而简单的风险价值那道截断线,恰恰一步就跨了过去。模型不是风险本身;而尾部,正是这道鸿沟施展破坏的地方。