严重度模型与重尾

这部机器的另一半

损失机器的一半你已经搭好了：在频率—严重度分解里，你把一批业务的成本拆成了*来多少次*理赔，以及*每次有多大*。本级前面几篇钉牢了频率这一侧——泊松与负二项这两个计数模型。这一篇转向另一半，也就是严重度：既然理赔已经发生，它要花掉多少美元？为这件事建模，正是理赔严重度分布的活儿——一个住在正数上的连续分布。

为什么非要给严重度建模——直接把过去的理赔平均一下不就完了吗？因为单凭平均值，会把那些足以让保险公司送命的东西藏起来。两批业务可以共有同一个平均理赔 4000 美元，可一批是源源不断的 4000 美元小擦碰，另一批却是一千笔 500 美元的刮蹭加上偶尔一桩 200 万美元的官司。平均值对得上；可它们的*形状*天差地别，而真正威胁偿付能力的只有其中一个。严重度分布捕捉的正是这整个形状——质量堆在哪里、右臂伸出多远，以及单单一笔理赔可能为自己攫走明年总额的多大一块。

严重度分布的角色阵容

当初你头一回逛精算工具箱时就见过这几个家族；这里我们让它们作为同一份工作的竞争者上场干活。指数分布是最简单的诚实初稿——单参数、恒定衰减，以及那条*无记忆*性质：损失再长 1000 美元的概率，无论它已经多大都不变。作为第一手猜测它不赖，但真实理赔数据几乎总是想要比它那一个旋钮更多的灵活度。

伽马分布添了一个形状参数，于是曲线可以先隆起一个峰、再回落——适合那些围着某个典型金额扎堆的中等理赔。威布尔分布有自己的形状旋钮，专管尾巴的脾性：往一边拧，尾巴又轻又规矩；往另一边拧，它就拉长开来——这正是工程师拿它来刻画失效与磨损寿命的缘故。对数正态分布讲的是一个*乘法*的故事——一笔由许多随机因子相乘而成的损失（一次维修取决于零件 × 工时 × 延误 × 撞击的猛烈程度），它的对数服从正态，整体呈现强烈的右偏，而这副形状恰能贴合出乎意料多的真实理赔数据。

然后就是帕累托分布，它自成一类，整个最后一节都留给它。眼下，先按尾部的轻重把其余几个排个队，从最轻到最重：指数和伽马衰减得快，对数正态拖得更远，威布尔能轻能重，而帕累托则拒绝消退。在它们之间取舍并不是一场选美——它是一场关于*最大*那些损失会如何表现的赌注，而那些损失恰恰是你手上数据最少的。

拟合一个严重度分布

选定一个家族只是工作的一半；你还得给它选定参数，让曲线真正贴合你的理赔。这就是损失分布拟合，它沿用你早先学过的那套估计思想，如今对准了赔付金额。最快的路子是矩估计法：算出过去理赔的样本均值与方差，再挑出能复现它们的参数。它快，能给一个像样的起点，但它倚仗的是低阶矩，于是几乎不理会尾部——而对严重度而言，钱恰恰就在那条尾巴上。

真正的主力则是极大似然估计：选那组参数，使你实际观察到的理赔最有可能出现。它用上每一个数据点，附带标准误让你知道每个估计有多飘，而且——这对保险至关重要——它可以写成尊重*删失*与*截断*数据的形式。这一点要紧，因为原始理赔数据极少是干净的：一道保单限额会给你能看到的金额封顶（在 100 万美元保单上发生的 300 万美元损失，账面上恰恰记成 100 万美元），而免赔额则截掉了那些根本没人来报的小额理赔。一个无视这些扭曲的拟合，会把尾部判断得离谱。

在候选者之间作出抉择

假设你把三个候选者——比如伽马、对数正态和帕累托——拟合到了同一批理赔上。你信哪一个？大致按下面这个次序，从三个方面去评判它们。

故事对得上吗？在任何算术之前，先问这个分布背后的故事是否契合这项风险。乘法式的损害指向对数正态；少数巨灾理赔混在众多小额之中则指向帕累托。一个故事讲错了的模型，即便数字看上去漂亮，也会把你引入歧途。
拟合有多好，又是否对复杂度做了诚实的惩罚？跑一遍拟合优度检验，把候选者们放在一起比。参数越多的分布，总能把数据贴得越紧，所以既要奖赏拟合、又要惩罚多余的参数——否则你奖赏的就只是过拟合的噪声，而非抓住真正的形状。
尾部贴合得如何——又有多稳？把目光最狠地盯在那些最大的理赔上，因为正是在那里，对躯干意见一致的候选者们分歧最大。然后换上略微不同的数据（或者干脆抽掉单笔最大的理赔）重新拟合，看看答案挪动了多少。若它一下子蹿动，说明你的尾部估计很脆，那就该往保守那边靠。

留意榜单上*没有*的那一条："中段误差最小的那个"。两个分布可以在普通理赔的主体部分几乎严丝合缝，所推出的尾部概率却能相差十倍。给一个高保单限额或一层再保险定价时，那些尾部概率就是问题的全部。挑选严重度模型，是为了画面里你几乎看不见的那一截——这恰恰说明，在此处，对其不确定性保持诚实，比在精算工作几乎任何其他地方都更要紧。

重尾：当一笔理赔就是整整一年

现在来到了关键。重尾意味着一笔巨额损失的概率消退得*很慢*——它按损失大小的某个幂次衰减，而不是按指数衰减。最干净的例子是帕累托严重度：把损失门槛翻一倍，超过它的概率只按一个固定的比例下降，无论你已经爬到多高都一样。其实践后果令人吃惊。在轻尾之下，你那一百笔普通理赔和那一笔大理赔，大体落在同一个金额量级里。而在重尾之下，一年里单笔最大的理赔，可能比其余所有理赔之和还要大。

这正是巨灾险与责任险所在的世界——地震、飓风、大规模侵权官司、流行病理赔。重尾打碎了你一直倚仗的那些舒适直觉。样本平均值收敛得*慢得叫人发疼*，因为它老在等下一笔会把它猛地往上拽的离奇损失，于是十个风平浪静的年头告诉你的，远比看上去要少。在最极端的重尾情形里，数学上的方差、甚至连均值本身，都是*无穷大*的——这意味着再多过去的数据也钉不住那个平均值，而你早先见过的那幅令人安心的中心极限图景，在这里压根儿不适用。

Pareto tail: P(loss > x) ~ (b / x)^a      (a = tail index)

  P(loss > $1,000,000) = 0.0100
  P(loss > $2,000,000) = 0.0050   (halve again per doubling, a=1)
  P(loss > $4,000,000) = 0.0025

Light (exponential) tail for contrast:
  P(loss > $1,000,000) = 0.0100
  P(loss > $2,000,000) = 0.0001   (vanishes far faster)

同样是 1% 的概率会有一笔 100 万美元损失，却是两个截然不同的世界。在幂律的帕累托下，400 万美元损失的概率是 100 万美元的四分之一；在指数下，它几乎已经消失。给一个高层级定价时，这道差距就是一切。

所以，对尾部要怀着谦卑。因为轻尾贴合了日常理赔、又显得整洁就选它，正是通向破产的经典路径之一：保险公司在太平年景里入账可观的利润，随后一桩它从未定价的尾部事件登场，把十年的盈余一笔抹平。这也正是为什么对尾部敏感的风险度量如此要紧——像尾部风险价值这样的度量，看的是越过某个门槛之后损失的*平均*大小，捕捉到了尾部的深度，而简单的风险价值那道截断线，恰恰一步就跨了过去。模型不是风险本身；而尾部，正是这道鸿沟施展破坏的地方。