藏在一筆保費裡的兩個承諾
本階到此為止,一直在打磨兩件工具。期望值給了你一個單一的公平價格——純保費——而變異數告訴你,任何一年都可能圍繞它擺動得有多劇烈。這兩者都是對單一風險的誠實描述。可保險公司從不只賣一份保單,它賣出成千上萬份。保險的魔力不在任何一份合同裡——它出現在你把許許多多份合同加在一起的那一刻。
當保險公司把一筆保費遞給你時,它其實在悄悄向自己的股東許下兩個承諾。第一:只要我們把足夠多的同類風險匯聚起來,平均理賠就會落在我們所收取的純保費附近,所以這個價格大致是對的。第二:儘管我們無法確定,但我們能框定總額合理地可能漂移到多遠,於是我們清楚地知道要在手邊留多少備用資金——也就是資本。這兩個承諾並非一廂情願,它們是整個機率論中最負盛名的兩條定理,而本篇就是要去認識它們。
大數定律:平均值會安定下來
拋一枚均勻的硬幣十次,你也許會看到七次正面——高達 70% 的瘋狂比例。拋它一萬次,你看到的會是無比接近 50% 的結果。這就是大數定律(LLN)的全部要旨:當你對同一件隨機事物做越來越多次相互獨立的觀測並求平均,這個平均值就會越來越靠近它的期望值,並不再上躥下跳。要緊的是,大數定律說的是關於*平均值*、而非*總和*的事——正面出現的總次數,按絕對值算其實會離 5,000 越來越遠;真正安定下來的,是每次拋擲的那個平均值。
回想上一篇:n 個相互獨立的副本求平均後,變異數會縮小為原來的 n 分之一——也就是說,均值的標準差按 n 的平方根分之一下降。這條平方根定律,正是大數定律捲起袖子幹活的樣子。把 100 份完全相同且相互獨立的保單匯聚起來,單份保單的平均值就比一份保單穩定十倍;匯聚 10,000 份,就穩定一百倍。這恰恰是基礎階裡那套風險匯聚機制,如今被陳述為一條定理、而不再只是一個類比。正因如此,保險公司才能報出那筆純保費,並相信在整本業務上,現實會配合演出。
中心極限定理:總和長成鐘形
大數定律告訴你平均值會落在大致正確的位置——但它對剩下那點不確定性的*形狀*隻字未提。那個形狀,正是中心極限定理(CLT)的饋贈,而它實在令人驚嘆。把許多相互獨立的風險加起來——無論每一個單獨看有多偏斜、扭曲或古怪——這個*總和*(或平均值)的分布都會漂向一個單一而普適的形狀:常態分布,也就是那條著名的鐘形曲線。這些單個風險可以是拋硬幣、擲骰子、牙科理賠,或是偏得離譜的彩票;總和卻忘掉了它們各自的脾性,只記住它們的均值和變異數。
為什麼你要在意總和是鐘形的呢?因為常態分布只需兩個數字就能被完整描述——它的均值和標準差——而這兩者我們都已經會算了。一旦精算師能論證一大本業務的總損失近似常態,整條尾巴就變得可以計算。那條熟悉的經驗法則隨之而出:大約 95% 的時候,總額會落在均值上下約兩個標準差之內,而超出這個範圍的罕見年份,則有著已知、可量化的機率。中心極限定理,正是把含糊的「我們可能虧很多」變成一個監管者和董事會真能據以籌劃的數字。
把它們用起來:先定價,再算資本
我們用上一篇裡那份小小的保單把這件事講實。每份保單有 5% 的機率賠 2,000,所以它的期望損失(純保費)是 100,標準差約為 436——超過均值的四倍。單獨一份這樣的保單,波動得嚇人。現在,相互獨立地承保 10,000 份。兩條定理就接管了局面。
One policy: E = 100 SD = 436 (SD/mean = 4.36, scary) 10,000 policies (independent): Total mean = 10,000 * 100 = 1,000,000 Total SD = 436 * sqrt(10,000) = 43,600 SD as % of mean = 43,600 / 1,000,000 = 4.36% (LLN: relative wobble shrank ~100x) CLT => total loss ~ Normal(1,000,000, 43,600) ~95% of years land within +/- 2 SD: 1,000,000 +/- 87,200 Capital to be ~99.5% safe (~2.58 SD): about 112,000 above the mean
把那張小表慢慢讀一遍,因為它用八行字寫盡了一家保險公司的全部邏輯。大數定律是第一個奇蹟:把 10,000 份相互獨立的保單匯聚起來,*平均*理賠就緊貼著 100,相對波動從足以傾家的 436% 坍縮到可控的 4.36%。正是這份穩定,使得收取那筆平均保費成為理智之舉。中心極限定理是第二個奇蹟:它擔保總和近似常態,於是保險公司可以說「要做到 99.5% 安全,我們必須在期望損失之上持有約 112,000 的資本」——這是一個精確、站得住腳的數字,而不是憑空一猜。價格來自第一條定理,資本來自第二條。
誠實的隱患:兩者都重重壓在獨立性上
現在,是那條把精算師和看熱鬧的人區分開來的警告。那張表裡每一個乾淨的數字,都壓在一個詞上:獨立。總標準差之所以只按 n 的平方根增長,唯一的原因是每份保單的結果與它鄰居的結果毫無瓜葛。這正是你在本階早些時候遇到的獨立性所扮演的精確角色。一旦失去它,那套讓保險看起來輕而易舉的算術,就會悄悄崩塌。
真實的風險常常根本就不獨立。一場地震、一場颶風、一場大流行或一次市場崩盤,會在同一瞬間擊中成千上萬份保單——它們的損失一起湧動。當風險正相關時,總和的變異數就不再除以 n 了;那份令人安心的平方根收縮會減弱乃至消失,而在完全相關的極端情形裡它徹底消失,讓你的處境並不比只持有一份巨型保單更好。大數定律不再安撫平均值,中心極限定理那隻整潔的鐘也長出一條肥厚而危險、被常態近似嚴重低估的尾巴。
還有一個更微妙的陷阱。即便有了真正的獨立性,中心極限定理說的也是關於分布*中心*的事;鐘形近似最糟糕的地方,恰恰就在遙遠的尾部,而那正是巨災棲身之處。常態曲線有著又薄、又迅速衰減的尾巴,可真實的保險損失往往是肥尾的——極端事件發生的頻率比鐘形所預言的要高。所以精算師只在這些定理可信之處(主體部分、以及可分散的風險)依靠它們,而在它們失效之處,正好轉向更嚴苛的工具——明確的巨災模型、相關性假設,以及肥尾分布。這些定理是地基,不是堡壘。
你要帶走的東西
現在你握住了那兩條定理:它們把一堆嚇人的單個風險,變成一門冷靜、可定價、有資本撐腰的生意——而同樣重要的是,你也清楚了它們共同倚仗的那一個假設,以及當它崩壞時會出什麼岔子。這是整個機率階的拱心石。從這裡開始,階梯將從描述單一分布,轉向把分布擬合到真實的理賠數據上、估計它們的參數、並量化我們對那些估計有多信任——這正是讓精算師去學得世界不肯直接交出的那些數字的統計學。