JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

两大定理:大数定律与中心极限定理

有两条定理在背后扛起了让保险得以成立的重活:一条说平均值会安定下来,另一条说总和会长成钟形。两者合在一起,既为收取一笔平均保费、也为持有资本提供了理由——前提是这些风险保持相互独立。

藏在一笔保费里的两个承诺

本阶到此为止,一直在打磨两件工具。期望值给了你一个单一的公平价格——纯保费——而方差告诉你,任何一年都可能围绕它摆动得有多剧烈。这两者都是对单一风险的诚实描述。可保险公司从不只卖一份保单,它卖出成千上万份。保险的魔力不在任何一份合同里——它出现在你把许许多多份合同加在一起的那一刻。

当保险公司把一笔保费递给你时,它其实在悄悄向自己的股东许下两个承诺。第一:只要我们把足够多的同类风险汇聚起来,平均理赔就会落在我们所收取的纯保费附近,所以这个价格大致是对的。第二:尽管我们无法确定,但我们能框定总额合理地可能漂移到多远,于是我们清楚地知道要在手边留多少备用资金——也就是资本。这两个承诺并非一厢情愿,它们是整个概率论中最负盛名的两条定理,而本篇就是要去认识它们。

大数定律:平均值会安定下来

抛一枚均匀的硬币十次,你也许会看到七次正面——高达 70% 的疯狂比例。抛它一万次,你看到的会是无比接近 50% 的结果。这就是大数定律(LLN)的全部要旨:当你对同一件随机事物做越来越多次相互独立的观测并求平均,这个平均值就会越来越靠近它的期望值,并不再上蹿下跳。要紧的是,大数定律说的是关于*平均值*、而非*总和*的事——正面出现的总次数,按绝对值算其实会离 5,000 越来越远;真正安定下来的,是每次抛掷的那个平均值。

回想上一篇:n 个相互独立的副本求平均后,方差会缩小为原来的 n 分之一——也就是说,均值的标准差按 n 的平方根分之一下降。这条平方根定律,正是大数定律卷起袖子干活的样子。把 100 份完全相同且相互独立的保单汇聚起来,单份保单的平均值就比一份保单稳定十倍;汇聚 10,000 份,就稳定一百倍。这恰恰是基础阶里那套风险汇聚机制,如今被陈述为一条定理、而不再只是一个类比。正因如此,保险公司才能报出那笔纯保费,并相信在整本业务上,现实会配合演出。

中心极限定理:总和长成钟形

大数定律告诉你平均值会落在大致正确的位置——但它对剩下那点不确定性的*形状*只字未提。那个形状,正是中心极限定理(CLT)的馈赠,而它实在令人惊叹。把许多相互独立的风险加起来——无论每一个单独看有多偏斜、扭曲或古怪——这个*总和*(或平均值)的分布都会漂向一个单一而普适的形状:正态分布,也就是那条著名的钟形曲线。这些单个风险可以是抛硬币、掷骰子、牙科理赔,或是偏得离谱的彩票;总和却忘掉了它们各自的脾性,只记住它们的均值和方差。

为什么你要在意总和是钟形的呢?因为正态分布只需两个数字就能被完整描述——它的均值和标准差——而这两者我们都已经会算了。一旦精算师能论证一大本业务的总损失近似正态,整条尾巴就变得可以计算。那条熟悉的经验法则随之而出:大约 95% 的时候,总额会落在均值上下约两个标准差之内,而超出这个范围的罕见年份,则有着已知、可量化的概率。中心极限定理,正是把含糊的“我们可能亏很多”变成一个监管者和董事会真能据以筹划的数字。

把它们用起来:先定价,再算资本

我们用上一篇里那份小小的保单把这件事讲实。每份保单有 5% 的概率赔 2,000,所以它的期望损失(纯保费)是 100,标准差约为 436——超过均值的四倍。单独一份这样的保单,波动得吓人。现在,相互独立地承保 10,000 份。两条定理就接管了局面。

One policy:   E = 100        SD = 436        (SD/mean = 4.36, scary)
10,000 policies (independent):
  Total mean   = 10,000 * 100         = 1,000,000
  Total SD     = 436 * sqrt(10,000)   = 43,600
  SD as % of mean = 43,600 / 1,000,000 = 4.36%   (LLN: relative wobble shrank ~100x)
CLT => total loss ~ Normal(1,000,000, 43,600)
  ~95% of years land within +/- 2 SD: 1,000,000 +/- 87,200
  Capital to be ~99.5% safe (~2.58 SD): about 112,000 above the mean
大数定律把相对波动从 436% 压到 4.36%;中心极限定理接着说总和是钟形的,于是一个选定的安全水平,就能直接换算成一笔资本数额。

把那张小表慢慢读一遍,因为它用八行字写尽了一家保险公司的全部逻辑。大数定律是第一个奇迹:把 10,000 份相互独立的保单汇聚起来,*平均*理赔就紧贴着 100,相对波动从足以倾家的 436% 坍缩到可控的 4.36%。正是这份稳定,使得收取那笔平均保费成为理智之举。中心极限定理是第二个奇迹:它担保总和近似正态,于是保险公司可以说“要做到 99.5% 安全,我们必须在期望损失之上持有约 112,000 的资本”——这是一个精确、站得住脚的数字,而不是凭空一猜。价格来自第一条定理,资本来自第二条。

诚实的隐患:两者都重重压在独立性上

现在,是那条把精算师和看热闹的人区分开来的警告。那张表里每一个干净的数字,都压在一个词上:独立。总标准差之所以只按 n 的平方根增长,唯一的原因是每份保单的结果与它邻居的结果毫无瓜葛。这正是你在本阶早些时候遇到的独立性所扮演的精确角色。一旦失去它,那套让保险看起来轻而易举的算术,就会悄悄崩塌。

真实的风险常常根本就不独立。一场地震、一场飓风、一场大流行或一次市场崩盘,会在同一瞬间击中成千上万份保单——它们的损失一起涌动。当风险正相关时,总和的方差就不再除以 n 了;那份令人安心的平方根收缩会减弱乃至消失,而在完全相关的极端情形里它彻底消失,让你的处境并不比只持有一份巨型保单更好。大数定律不再安抚平均值,中心极限定理那只整洁的钟也长出一条肥厚而危险、被正态近似严重低估的尾巴。

还有一个更微妙的陷阱。即便有了真正的独立性,中心极限定理说的也是关于分布*中心*的事;钟形近似最糟糕的地方,恰恰就在遥远的尾部,而那正是巨灾栖身之处。正态曲线有着又薄、又迅速衰减的尾巴,可真实的保险损失往往是肥尾的——极端事件发生的频率比钟形所预言的要高。所以精算师只在这些定理可信之处(主体部分、以及可分散的风险)依靠它们,而在它们失效之处,正好转向更严苛的工具——明确的巨灾模型、相关性假设,以及肥尾分布。这些定理是地基,不是堡垒。

你要带走的东西

现在你握住了那两条定理:它们把一堆吓人的单个风险,变成一门冷静、可定价、有资本撑腰的生意——而同样重要的是,你也清楚了它们共同倚仗的那一个假设,以及当它崩坏时会出什么岔子。这是整个概率阶的拱心石。从这里开始,阶梯将从描述单一分布,转向把分布拟合到真实的理赔数据上、估计它们的参数、并量化我们对那些估计有多信任——这正是让精算师去学得世界不肯直接交出的那些数字的统计学。