兩大定理：大數定律與中心極限定理

藏在一筆保費裡的兩個承諾

本階到此為止，一直在打磨兩件工具。期望值給了你一個單一的公平價格——純保費——而變異數告訴你，任何一年都可能圍繞它擺動得有多劇烈。這兩者都是對單一風險的誠實描述。可保險公司從不只賣一份保單，它賣出成千上萬份。保險的魔力不在任何一份合同裡——它出現在你把許許多多份合同加在一起的那一刻。

當保險公司把一筆保費遞給你時，它其實在悄悄向自己的股東許下兩個承諾。第一：只要我們把足夠多的同類風險匯聚起來，平均理賠就會落在我們所收取的純保費附近，所以這個價格大致是對的。第二：儘管我們無法確定，但我們能框定總額合理地可能漂移到多遠，於是我們清楚地知道要在手邊留多少備用資金——也就是資本。這兩個承諾並非一廂情願，它們是整個機率論中最負盛名的兩條定理，而本篇就是要去認識它們。

大數定律：平均值會安定下來

拋一枚均勻的硬幣十次，你也許會看到七次正面——高達 70% 的瘋狂比例。拋它一萬次，你看到的會是無比接近 50% 的結果。這就是大數定律（LLN）的全部要旨：當你對同一件隨機事物做越來越多次相互獨立的觀測並求平均，這個平均值就會越來越靠近它的期望值，並不再上躥下跳。要緊的是，大數定律說的是關於*平均值*、而非*總和*的事——正面出現的總次數，按絕對值算其實會離 5,000 越來越遠；真正安定下來的，是每次拋擲的那個平均值。

回想上一篇：n 個相互獨立的副本求平均後，變異數會縮小為原來的 n 分之一——也就是說，均值的標準差按 n 的平方根分之一下降。這條平方根定律，正是大數定律捲起袖子幹活的樣子。把 100 份完全相同且相互獨立的保單匯聚起來，單份保單的平均值就比一份保單穩定十倍；匯聚 10,000 份，就穩定一百倍。這恰恰是基礎階裡那套風險匯聚機制，如今被陳述為一條定理、而不再只是一個類比。正因如此，保險公司才能報出那筆純保費，並相信在整本業務上，現實會配合演出。

中心極限定理：總和長成鐘形

大數定律告訴你平均值會落在大致正確的位置——但它對剩下那點不確定性的*形狀*隻字未提。那個形狀，正是中心極限定理（CLT）的饋贈，而它實在令人驚嘆。把許多相互獨立的風險加起來——無論每一個單獨看有多偏斜、扭曲或古怪——這個*總和*（或平均值）的分布都會漂向一個單一而普適的形狀：常態分布，也就是那條著名的鐘形曲線。這些單個風險可以是拋硬幣、擲骰子、牙科理賠，或是偏得離譜的彩票；總和卻忘掉了它們各自的脾性，只記住它們的均值和變異數。

為什麼你要在意總和是鐘形的呢？因為常態分布只需兩個數字就能被完整描述——它的均值和標準差——而這兩者我們都已經會算了。一旦精算師能論證一大本業務的總損失近似常態，整條尾巴就變得可以計算。那條熟悉的經驗法則隨之而出：大約 95% 的時候，總額會落在均值上下約兩個標準差之內，而超出這個範圍的罕見年份，則有著已知、可量化的機率。中心極限定理，正是把含糊的「我們可能虧很多」變成一個監管者和董事會真能據以籌劃的數字。

把它們用起來：先定價，再算資本

我們用上一篇裡那份小小的保單把這件事講實。每份保單有 5% 的機率賠 2,000，所以它的期望損失（純保費）是 100，標準差約為 436——超過均值的四倍。單獨一份這樣的保單，波動得嚇人。現在，相互獨立地承保 10,000 份。兩條定理就接管了局面。

One policy:   E = 100        SD = 436        (SD/mean = 4.36, scary)
10,000 policies (independent):
  Total mean   = 10,000 * 100         = 1,000,000
  Total SD     = 436 * sqrt(10,000)   = 43,600
  SD as % of mean = 43,600 / 1,000,000 = 4.36%   (LLN: relative wobble shrank ~100x)
CLT => total loss ~ Normal(1,000,000, 43,600)
  ~95% of years land within +/- 2 SD: 1,000,000 +/- 87,200
  Capital to be ~99.5% safe (~2.58 SD): about 112,000 above the mean

大數定律把相對波動從 436% 壓到 4.36%；中心極限定理接著說總和是鐘形的，於是一個選定的安全水平，就能直接換算成一筆資本數額。

把那張小表慢慢讀一遍，因為它用八行字寫盡了一家保險公司的全部邏輯。大數定律是第一個奇蹟：把 10,000 份相互獨立的保單匯聚起來，*平均*理賠就緊貼著 100，相對波動從足以傾家的 436% 坍縮到可控的 4.36%。正是這份穩定，使得收取那筆平均保費成為理智之舉。中心極限定理是第二個奇蹟：它擔保總和近似常態，於是保險公司可以說「要做到 99.5% 安全，我們必須在期望損失之上持有約 112,000 的資本」——這是一個精確、站得住腳的數字，而不是憑空一猜。價格來自第一條定理，資本來自第二條。

誠實的隱患：兩者都重重壓在獨立性上

現在，是那條把精算師和看熱鬧的人區分開來的警告。那張表裡每一個乾淨的數字，都壓在一個詞上：獨立。總標準差之所以只按 n 的平方根增長，唯一的原因是每份保單的結果與它鄰居的結果毫無瓜葛。這正是你在本階早些時候遇到的獨立性所扮演的精確角色。一旦失去它，那套讓保險看起來輕而易舉的算術，就會悄悄崩塌。

真實的風險常常根本就不獨立。一場地震、一場颶風、一場大流行或一次市場崩盤，會在同一瞬間擊中成千上萬份保單——它們的損失一起湧動。當風險正相關時，總和的變異數就不再除以 n 了；那份令人安心的平方根收縮會減弱乃至消失，而在完全相關的極端情形裡它徹底消失，讓你的處境並不比只持有一份巨型保單更好。大數定律不再安撫平均值，中心極限定理那隻整潔的鐘也長出一條肥厚而危險、被常態近似嚴重低估的尾巴。

還有一個更微妙的陷阱。即便有了真正的獨立性，中心極限定理說的也是關於分布*中心*的事；鐘形近似最糟糕的地方，恰恰就在遙遠的尾部，而那正是巨災棲身之處。常態曲線有著又薄、又迅速衰減的尾巴，可真實的保險損失往往是肥尾的——極端事件發生的頻率比鐘形所預言的要高。所以精算師只在這些定理可信之處（主體部分、以及可分散的風險）依靠它們，而在它們失效之處，正好轉向更嚴苛的工具——明確的巨災模型、相關性假設，以及肥尾分布。這些定理是地基，不是堡壘。

你要帶走的東西

現在你握住了那兩條定理：它們把一堆嚇人的單個風險，變成一門冷靜、可定價、有資本撐腰的生意——而同樣重要的是，你也清楚了它們共同倚仗的那一個假設，以及當它崩壞時會出什麼岔子。這是整個機率階的拱心石。從這裡開始，階梯將從描述單一分布，轉向把分布擬合到真實的理賠數據上、估計它們的參數、並量化我們對那些估計有多信任——這正是讓精算師去學得世界不肯直接交出的那些數字的統計學。