從匯聚風險到度量機遇
在「風險基礎」那一階,你已經看到保險公司為何能把許多微小、不可預測的損失匯聚成一個龐大而可預測的整體——這正是保險的核心,也是可保風險必須在投保人之間大致相互獨立的原因。但「可預測」是一個必須用數字兌現的承諾。要替保單定價、釐定保費或提存準備金,精算師必須說清一次損失有多「可能」、又通常有多「大」。「可能」這個詞,正是機率要把它說精確的對象。
機率是不確定性的語法。我們不會把它當作一堵公式之牆去死記;相反,我們先建立直覺,再讓每一條公式作為這套語法中的一句話自然登場。讀完本章,你將真正掌握貫穿整個精算課程的三件工具:任何合理的機率都必須遵守的法則、根據已知資訊進行「條件化」的技藝,以及貝氏定理——當世界遞給你一條新線索時,用來改變想法的機器。
樣本空間與事件:所有可能性的地圖
在度量機遇之前,我們必須先列出機遇是在哪些可能性之間作選擇。某個試驗中可能發生的所有結果的完整清單,就是[[sample-space|樣本空間]]。擲一顆骰子,它就是六個面 {1,2,3,4,5,6};問一位投保人今年是否會出險,它就只是 {出險,不出險}。樣本空間是那片疆域,其餘的一切都畫在它之上。
事件不過是我們所關心的任意一組結果——地圖上的一塊區域。「骰子擲出偶數」就是事件 {2,4,6}。由於事件就是集合,我們用集合運算來組合它們:*聯集* A∪B(「A 或 B 發生」)、*交集* A∩B(「兩者同時發生」)以及*補集*(「A 不發生」)。精算師就活在這套語言裡:「同一年裡既有火災索賠*又*有竊盜索賠」是交集;「出現任何索賠」則是所有損失類型的聯集。
每個機率都必須遵守的三條法則
機率給每個事件賦予一個數字,用來度量我們對它的期待有多強。為了不讓我們隨意賦予荒謬的數值,數學家釘下了一組最小的常識性規則——[[probability-axioms|機率公理]]——其餘的一切都由此推出。其一,任何機率都不為負。其二,整個樣本空間的機率為 1:清單裡*總有某件事*會發生。其三,對於不可能重疊的事件,機率就直接相加:當 A 與 B 互斥時,P(A 或 B) = P(A) + P(B)。
這三行話出人意料地強大。僅憑它們就能推出補集法則——P(非 A) = 1 − P(A),這是精算師最愛的捷徑:若「不出險」的機率是 0.92,那麼「至少出一次險」的機率就是 0.08,無需任何額外計算。而當事件*確實可能*重疊時,加法法則會自我修正,以免把重疊部分重複計算:P(A∪B) = P(A) + P(B) − P(A∩B)。
條件化與獨立性:新資訊的作用
真實的核保從不在真空中進行——你對眼前的風險總是知道*一些*情況。[[conditional-probability|條件機率]]記作 P(A | B),讀作「在 B 發生的條件下 A 的機率」,正好刻畫了這一點:一旦得知 B 為真,A 變得有多可能。其原理很直觀——我們把樣本空間收縮到只剩 B 發生的那些情形,再問*這些*情形中有多大比例同時也包含 A:P(A | B) = P(A∩B) / P(B)。
設想 1000 名駕駛人,其中 100 名未滿 25 歲。假設今年有 60 人發生事故,其中 30 人正是這些年輕人。無條件的事故率是 60/1000 = 6%。但*在已知*駕駛人未滿 25 歲的條件下,事故率躍升至 30/100 = 30%。年齡告訴了我們一些資訊——這正是條件化在起作用,也正是保險公司按風險類別定價、而非對所有人收取同一價格的原因。
當得知一個事件對另一個事件毫無資訊時,這兩個事件就是[[statistical-independence|獨立]]的——形式上寫作 P(A | B) = P(A),等價於 P(A∩B) = P(A)·P(B)。獨立性是默默支撐整座保險大廈的隱含假設:風險匯聚之所以能馴服風險,正因為投保人的損失*大致*相互獨立。一旦這一點失效——颶風、大流行病、市場崩盤同時擊中成千上萬張保單——損失便結伴而來,那種令人安心的平均效應隨之瓦解,整個風險池可能被壓垮。誠實的建模意味著每一次都要追問:獨立性是否真的成立。
貝氏定理:誠實地改變想法
條件化通常沿著資料流動的方向運行:高風險駕駛人更可能出事故。但保險公司往往需要*反向*運行它——在看到一次事故(或一次索賠,或一次陽性體檢結果)之後,我們該如何修正對其背後隱藏成因的判斷?把那個箭頭反轉過來,正是[[act-bayes-theorem|貝氏定理]]所做的事。與其把它當作令人生畏的公式,不如把它看作一套有紀律的更新配方:從你在證據出現*之前*的判斷出發(先驗),按每個假設對證據的解釋力給它加權(似然),再重新歸一化。
來看保險味道的版本。假設新車險投保人中有 10% 確實屬於高風險。高風險駕駛人第一年出險的機率為 50%;標準駕駛人則只有 10%。如今一位新投保人出險了。他一開始就屬於高風險的機率有多大?在每 1000 名投保人中,100 名是高風險、900 名是標準風險。高風險的出險者:100 × 0.5 = 50。標準風險的出險者:900 × 0.1 = 90。於是共出現 50 + 90 = 140 次索賠,其中 50 次來自高風險駕駛人。
P(high-risk | claim) = (0.10 x 0.50) / (0.10 x 0.50 + 0.90 x 0.10)
= 0.050 / (0.050 + 0.090)
= 0.050 / 0.140
= 0.357 (about 36%)請留意那 36% 背後藏著的誠實教訓。一次索賠確實是真實的證據——我們的信念翻了三倍多,從 10% 升到 36%——然而大多數出險者仍是只是遇上倒楣一年的標準風險駕駛人。把每一位出險者都斷定為高風險加以懲罰,既不公平,在統計上也是錯的。這種按證據比例*逐步*更新的貝氏習慣,正是可信度理論的種子——保險公司在那裡會把投保人自身的經驗與更廣的風險池融合起來,這是你在階梯上很久之後才會遇到的工具;而把同一筆損失看作隨機變數的視角,則是後續幾篇指南所要展開的基礎。
讓這套工具上場
本指南中的一切,都是精算師無休止重複的同一個推理迴圈。它的運行方式如下,而「機率」這一整階所做的,無非是為其中每一步配上更鋒利的工具。
- 命名樣本空間——哪怕只是粗略地,列出該風險可能產生的每一種結果。
- 界定要緊的事件——一次索賠、一筆超過自負額的損失、一年內的死亡——把它們定義為上述結果的集合。
- 賦予遵守公理的機率,再針對你對該風險真正了解的一切進行條件化。
- 當新證據出現時,用貝氏按比例更新你的信念——切勿對單一資料點反應過度。
請始終懷著一份謙遜:我們寫下的每一個機率,本身都是從資料與判斷中得來的估計,而非自然法則。一個賦予清晰數字的模型,給人的確定感往往超過它應得的程度。高明的精算師既精確地運用這些工具,*又*牢記它們終究只是工具——是地圖,而永遠不完全是疆域本身。請把這份雙重的自律,一併帶入接下來的機率分布與期望值之中。