從結果到數字
上一篇我們搭好了舞台:一個包含所有可能結果的樣本空間,並在其上鋪開機率。但結果常常是笨拙的東西——比如「投保人報了一起火災理賠,廚房燒毀但車庫倖免」。要給風險定價,我們需要去*度量*結果,而不只是把它們羅列出來。隨機變量正是做這件事的工具:它不過是一條把數字賦予每一個結果的規則。
設想某輛汽車的一年期保單。結果可能是「沒出事」「一次小擦撞」「一場嚴重事故」等等。我們把 X 定義為*這張保單提交的理賠次數*。於是「沒出事」對應 X = 0,「一次小擦撞」對應 X = 1,依此類推。我們並沒有改變世界——只是選了一副會報出數字的透鏡。大寫字母 X 是這個變量;它實際落到的某個具體取值(比如 2)則用小寫字母 x 表示。
兩種風味:計數與量度
隨機變量分成兩大家族,而這條離散與連續之分貫穿了精算師所做的一切。離散隨機變量取的值可以一個一個列出來——通常是整數。保單上的理賠*次數*就是離散的:0、1、2、3 次,絕不會是 2.4 次。連續隨機變量則可以落在某個區間內的任何位置,像在一個沒有縫隙的平滑刻度盤上。以美元計的理賠*金額*就是連續的:它可能是 1203.77 美元、1203.78 美元,或介於其間的任何數。
這種劃分並非純學術——它決定了你該動用哪套數學。離散變量靠求和處理;連續變量靠積分處理(求和的平滑表親)。保險定價恰好就坐落在這條接縫上:損失*多久發生一次*通常用像卜瓦松分布這樣的離散模型來計數,而每次損失*有多大*則用像指數分布或常態分布這樣的連續模型來量度。這對「頻率與嚴重度」的搭檔,你日後會一再遇到。
機率藏在哪裡:質量與密度
知道 X 是離散還是連續還不夠;我們必須說清*每個取值上壓著多少機率*。對離散的 X,這件事既簡單又直白。機率質量函數記作 p(x),給出每個取值的真實機率——又因為*總得發生點什麼*,所有質量加起來恰好等於 1。對我們的汽車保單,可能有 p(0) = 0.90、p(1) = 0.08、p(2) = 0.018、p(3) = 0.002。每一個都是你真能下注的實實在在的機率。
連續變量藏著一處優美的微妙。試問:「理賠金額*恰好*等於 1203.770000… 美元的機率是多少?」答案是零——可能的金額有無窮多個,所以任何單獨一個都不帶任何分量。機率住在*區間*裡,而不在某個點上。因此對連續的 X,我們不用質量,而用機率密度函數 f(x) 來描述。密度本身不是機率;它是*每單位 x 上的*機率,就像機率鋪得有多厚。要得到真正的機率,你得取曲線下、兩個取值之間的面積。f(x) 下方的總面積等於 1。
累積分布函數:一個對誰都管用的函數
質量與密度用不同的方言描述離散與連續變量。而累積分布函數記作 F(x),對兩者講同一種語言。它回答一個不斷累加的問題:「X 取值*不超過* x 的機率是多少?」——也就是 F(x) = P(X ≤ x)。當你讓 x 從最左掃到最右,F 便從 0 一路爬升到 1,絕不回頭,把途經的所有機率統統累積起來。
F 的形狀悄悄透露了 X 的風味。對離散變量,F 是一段樓梯:先是平直,然後在每個取值處突然跳一下,而跳躍的高度*正是*該取值的質量。對我們的汽車保單,F 在剛好不到 1 次理賠時停在 0.90,到 x = 1 處一躍增加 0.08,升到 0.98。對連續變量,F 則是一道平滑的斜坡,沒有跳躍,因為沒有任何單點帶分量。這正是精算師鍾愛累積分布函數的原因:它能處理真實資料裡那種彆扭的混合——「零次理賠」處一根肥厚的機率尖峰,緊挨著正理賠金額那片平滑鋪開的分布。
P(X = 0) = 0.90 F(0) = 0.90 P(X = 1) = 0.08 F(1) = 0.98 P(X = 2) = 0.018 F(2) = 0.998 P(X = 3) = 0.002 F(3) = 1.000 P(at least 1 claim) = 1 - F(0) = 0.10
一個分布就是故事的全部
把這些拼塊合起來,你就抵達了核心思想:X 的分布是對這個不確定量的完整描述。給我質量函數,或密度,或累積分布函數——任意一個即可,因為彼此都能互相還原——我便知道了在自然做出選擇*之前*關於 X 所能知道的一切。關於理賠次數,並沒有什麼進一步的隱藏事實等著被揭示;分布早已把所有可能性及其權重的完整菜單編碼在內。
正因如此,下一篇才能把期望值——X 的長期平均取值——當作某種我們*從分布中算出來*的東西來討論。一旦你握住了整個分布,平均理賠次數、離散程度、遇上糟糕年份的機率:全都隨之而來。精算工作在很大程度上,歸根結底就是為某項風險挑一個合理的分布,再從中擠出保費與準備金所依賴的那些數字。
但有一件事要誠實面對:分布是一個*模型*,而非真實世界本身。我們從來觀測不到一張保單的真實分布;我們只是*選*一個——比如給計數選一個卜瓦松分布——再從資料中估計它的參數,心裡清楚擬合並不完美。模型是一張忠實的地圖,卻不是疆域本身。後面好幾個階梯專門講如何把分布選好、如何拿它去對照現實,以及對那條遙遠的尾部保持謙卑——罕見的巨災正藏在那裡,多少自信滿滿的模型也正是栽在那裡。