機率基礎：事件、條件機率與貝氏定理

從匯聚風險到度量機遇

在「風險基礎」那一階，你已經看到保險公司為何能把許多微小、不可預測的損失匯聚成一個龐大而可預測的整體——這正是保險的核心，也是可保風險必須在投保人之間大致相互獨立的原因。但「可預測」是一個必須用數字兌現的承諾。要替保單定價、釐定保費或提存準備金，精算師必須說清一次損失有多「可能」、又通常有多「大」。「可能」這個詞，正是機率要把它說精確的對象。

機率是不確定性的語法。我們不會把它當作一堵公式之牆去死記；相反，我們先建立直覺，再讓每一條公式作為這套語法中的一句話自然登場。讀完本章，你將真正掌握貫穿整個精算課程的三件工具：任何合理的機率都必須遵守的法則、根據已知資訊進行「條件化」的技藝，以及貝氏定理——當世界遞給你一條新線索時，用來改變想法的機器。

樣本空間與事件：所有可能性的地圖

在度量機遇之前，我們必須先列出機遇是在哪些可能性之間作選擇。某個試驗中可能發生的所有結果的完整清單，就是[[sample-space|樣本空間]]。擲一顆骰子，它就是六個面 {1,2,3,4,5,6}；問一位投保人今年是否會出險，它就只是 {出險，不出險}。樣本空間是那片疆域，其餘的一切都畫在它之上。

事件不過是我們所關心的任意一組結果——地圖上的一塊區域。「骰子擲出偶數」就是事件 {2,4,6}。由於事件就是集合，我們用集合運算來組合它們：*聯集* A∪B（「A 或 B 發生」）、*交集* A∩B（「兩者同時發生」）以及*補集*（「A 不發生」）。精算師就活在這套語言裡：「同一年裡既有火災索賠*又*有竊盜索賠」是交集；「出現任何索賠」則是所有損失類型的聯集。

每個機率都必須遵守的三條法則

機率給每個事件賦予一個數字，用來度量我們對它的期待有多強。為了不讓我們隨意賦予荒謬的數值，數學家釘下了一組最小的常識性規則——[[probability-axioms|機率公理]]——其餘的一切都由此推出。其一，任何機率都不為負。其二，整個樣本空間的機率為 1：清單裡*總有某件事*會發生。其三，對於不可能重疊的事件，機率就直接相加：當 A 與 B 互斥時，P(A 或 B) = P(A) + P(B)。

這三行話出人意料地強大。僅憑它們就能推出補集法則——P(非 A) = 1 − P(A)，這是精算師最愛的捷徑：若「不出險」的機率是 0.92，那麼「至少出一次險」的機率就是 0.08，無需任何額外計算。而當事件*確實可能*重疊時，加法法則會自我修正，以免把重疊部分重複計算：P(A∪B) = P(A) + P(B) − P(A∩B)。

條件化與獨立性：新資訊的作用

真實的核保從不在真空中進行——你對眼前的風險總是知道*一些*情況。[[conditional-probability|條件機率]]記作 P(A | B)，讀作「在 B 發生的條件下 A 的機率」，正好刻畫了這一點：一旦得知 B 為真，A 變得有多可能。其原理很直觀——我們把樣本空間收縮到只剩 B 發生的那些情形，再問*這些*情形中有多大比例同時也包含 A：P(A | B) = P(A∩B) / P(B)。

設想 1000 名駕駛人，其中 100 名未滿 25 歲。假設今年有 60 人發生事故，其中 30 人正是這些年輕人。無條件的事故率是 60/1000 = 6%。但*在已知*駕駛人未滿 25 歲的條件下，事故率躍升至 30/100 = 30%。年齡告訴了我們一些資訊——這正是條件化在起作用，也正是保險公司按風險類別定價、而非對所有人收取同一價格的原因。

當得知一個事件對另一個事件毫無資訊時，這兩個事件就是[[statistical-independence|獨立]]的——形式上寫作 P(A | B) = P(A)，等價於 P(A∩B) = P(A)·P(B)。獨立性是默默支撐整座保險大廈的隱含假設：風險匯聚之所以能馴服風險，正因為投保人的損失*大致*相互獨立。一旦這一點失效——颶風、大流行病、市場崩盤同時擊中成千上萬張保單——損失便結伴而來，那種令人安心的平均效應隨之瓦解，整個風險池可能被壓垮。誠實的建模意味著每一次都要追問：獨立性是否真的成立。

貝氏定理：誠實地改變想法

條件化通常沿著資料流動的方向運行：高風險駕駛人更可能出事故。但保險公司往往需要*反向*運行它——在看到一次事故（或一次索賠，或一次陽性體檢結果）之後，我們該如何修正對其背後隱藏成因的判斷？把那個箭頭反轉過來，正是[[act-bayes-theorem|貝氏定理]]所做的事。與其把它當作令人生畏的公式，不如把它看作一套有紀律的更新配方：從你在證據出現*之前*的判斷出發（先驗），按每個假設對證據的解釋力給它加權（似然），再重新歸一化。

來看保險味道的版本。假設新車險投保人中有 10% 確實屬於高風險。高風險駕駛人第一年出險的機率為 50%；標準駕駛人則只有 10%。如今一位新投保人出險了。他一開始就屬於高風險的機率有多大？在每 1000 名投保人中，100 名是高風險、900 名是標準風險。高風險的出險者：100 × 0.5 = 50。標準風險的出險者：900 × 0.1 = 90。於是共出現 50 + 90 = 140 次索賠，其中 50 次來自高風險駕駛人。

P(high-risk | claim) = (0.10 x 0.50) / (0.10 x 0.50 + 0.90 x 0.10)
                     = 0.050 / (0.050 + 0.090)
                     = 0.050 / 0.140
                     = 0.357  (about 36%)

「高風險」的先驗信念在觀察到一次索賠後，從 10% 升至約 36%——但遠未達到確定。

請留意那 36% 背後藏著的誠實教訓。一次索賠確實是真實的證據——我們的信念翻了三倍多，從 10% 升到 36%——然而大多數出險者仍是只是遇上倒楣一年的標準風險駕駛人。把每一位出險者都斷定為高風險加以懲罰，既不公平，在統計上也是錯的。這種按證據比例*逐步*更新的貝氏習慣，正是可信度理論的種子——保險公司在那裡會把投保人自身的經驗與更廣的風險池融合起來，這是你在階梯上很久之後才會遇到的工具；而把同一筆損失看作隨機變數的視角，則是後續幾篇指南所要展開的基礎。

讓這套工具上場

本指南中的一切，都是精算師無休止重複的同一個推理迴圈。它的運行方式如下，而「機率」這一整階所做的，無非是為其中每一步配上更鋒利的工具。

命名樣本空間——哪怕只是粗略地，列出該風險可能產生的每一種結果。
界定要緊的事件——一次索賠、一筆超過自負額的損失、一年內的死亡——把它們定義為上述結果的集合。
賦予遵守公理的機率，再針對你對該風險真正了解的一切進行條件化。
當新證據出現時，用貝氏按比例更新你的信念——切勿對單一資料點反應過度。

請始終懷著一份謙遜：我們寫下的每一個機率，本身都是從資料與判斷中得來的估計，而非自然法則。一個賦予清晰數字的模型，給人的確定感往往超過它應得的程度。高明的精算師既精確地運用這些工具，*又*牢記它們終究只是工具——是地圖，而永遠不完全是疆域本身。請把這份雙重的自律，一併帶入接下來的機率分布與期望值之中。