貝氏視角與經驗貝氏

信度，原來是喬裝打扮的貝氏定理

到現在，信度公式已經讓你覺得眼熟：把投保人自己的經驗跟投資組合的平均值摻在一起，給個人資料配上權重 Z、給平均值配上權重（1 減 Z）。前面幾篇用兩種方式為 Z 尋找理由——先是要求資料足夠穩定（有限波動），再是把平方誤差最小化（Bühlmann 信度）。兩條路幾乎都憑著工程師的直覺，落到了一個加權平均上。本篇要揭示更深一層的真相：這個摻和並不是某種近似、也不是什麼巧妙的啟發式做法。對一大類既寬廣又重要的模型而言，它恰恰就是機率法則所要求的那個答案。信度，正是披著精算師外套的貝氏更新。

回想機率論那一階裡的貝氏定理。它是一條在證據面前改變想法的規則。你先有一個先驗——在看到這位投保人的資料之前，你對某個未知量所持的信念。這裡的未知量，是這位投保人自己真實的風險水平——記作 θ——它對你是隱藏的，因為風險本就看不見。這個先驗，是整個投資組合教給你的東西：θ 在一個又一個客戶之間是如何變化的。接著，這位客戶產生了一些理賠，這便是證據。貝氏定理機械地把先驗和證據合成一個後驗——也就是當你觀察這個人一段時間之後，對他那個 θ 所持的、更新過的信念。

看看這個後驗究竟是什麼。先驗以投資組合的平均值為中心——那正是每個新人起步時所用的標準費率。證據則把估計往客戶自己觀測到的經驗上拽。後驗最終落在兩者之間的某處：當你的資料很多時它偏向資料，當資料很少時它偏向先驗。這恰恰就是那個信度摻和。所以貝氏信度並不是你已經學過的東西的對手——它是那些東西的根基。你之前算出來的那個 Z，一直都是後驗在悄聲說話。

乾淨俐落的共軛故事：卜瓦松遇上伽瑪

貝氏定理是誠實的，但一般而言它是一場算術噩夢——後驗是一個積分，極少有整潔的形式。然而存在一對魔法般的搭配，能讓它始終保持簡單；它之所以是教科書裡的範例，正是因為這是你能徒手算出來的那一個。把每位投保人的年度理賠次數建模為參數是其個人比率 θ 的卜瓦松分布。放眼整個投資組合，這些 θ 值本身是變動的，我們用一個伽瑪分布作為先驗來刻畫這種分散。伽瑪正是為了與卜瓦松概似相配而塑造出來的先驗，二者天生一對。

下面是那個小小的奇蹟。當先驗是伽瑪、資料是卜瓦松時，後驗又是一個伽瑪——還是同一個家族，只是參數更新了。一個其形態能像這樣在更新中倖存下來的先驗，就叫共軛先驗；而卜瓦松資料的共軛先驗，恰恰就是伽瑪。這個更新簡單得近乎荒唐：伽瑪的兩個參數常被暱稱為「形狀」和「速率」。要得到後驗，你把觀測到的理賠總數加到形狀上，把觀察的年數加到速率上。整個計算就這些——加法而已。

Prior belief about a driver's true rate theta:  Gamma(shape=3, rate=2)
   prior mean = shape / rate = 3 / 2 = 1.5 claims per year  (the manual rate)

Observe this driver for 4 years: 2 + 1 + 0 + 1 = 4 claims total

Posterior  = Gamma(shape + claims, rate + years)
           = Gamma(3 + 4, 2 + 4) = Gamma(7, 6)
   posterior mean = 7 / 6 = 1.167 claims per year   <- the new premium rate

It is a credibility blend:  1.167 = Z * (own rate) + (1-Z) * 1.5
   own observed rate = 4 claims / 4 years = 1.0
   1.167 = Z*1.0 + (1-Z)*1.5  ->  Z = 4 / (4 + 2) = 0.667
   Z = years / (years + rate-parameter)  <- exactly the Buhlmann form, k = 2

卜瓦松-伽瑪後驗均值，就是信度保費本身：給自己的經驗配上權重 Z = 年數/(年數+k)，其餘配給先驗。沒有任何近似——Bühlmann 的線性摻和，在這裡就是精確的貝氏答案。

盯著這些算出來的數字，關鍵的那一擊就落了下來。後驗均值 1.167，字面上就是這位司機自己的比率（1.0）與標準費率（1.5）的一個加權平均，權重 Z = 0.667——而這個 Z 等於年數除以（年數加上一個常數）。那個常數不是別的，正是 Bühlmann 的信度常數 k。於是，精確的貝氏保費與近似的 Bühlmann 信度保費並不只是接近而已；對卜瓦松-伽瑪模型，它們就是同一個數字。原來在這個情形裡，Bühlmann 那條線性捷徑，根本就不是什麼捷徑——它就是真相。

為什麼這要緊——以及它在哪裡不再精確

這種一致令人安心，但我們得誠實地說清楚為什麼 Bühlmann 仍然值得掌握。精確的貝氏後驗之所以這麼乾淨，只是因為先驗和概似恰好共軛。換上另一種理賠分布、或者一個不那麼配合的先驗，後驗就會變成一個沒有閉式解的積分，逼著你要麼做繁重的數值計算、要麼搞模擬。Bühlmann 的高明之處在於他索取得更少：他不求完整的後驗，只求對它最好的那條直線近似。這個線性估計對任何模型都只需幾個動差就能算出來；而在共軛的那些情形裡，它一分錢代價都不要你付，因為它恰好就是精確的。

這裡還有一個更微妙的誠實之處。整套貝氏故事都建立在先驗正確這一前提上——建立在伽瑪確實刻畫了風險在你客戶之間如何變化這件事上。如果先驗選得很糟，那麼無論湧入多少資料，後驗都會繼承這份缺陷（不過謝天謝地，足夠多的資料最終會把一個錯誤的先驗淹沒掉）。可是在實務中，一位剛入職的精算師，又能從哪裡弄來一個值得信賴的先驗？沒人是揣著一個先驗走進門的。這道鴻溝——一套優美的理論，卻需要一個你手上沒有的輸入——恰恰就是本篇最後那個想法要去填補的。

經驗貝氏：讓資料自己把先驗遞給你

現在來看實務上的窘境。貝氏這套配方需要一個先驗——對 Bühlmann 來說，那意味著兩個結構性的數字：整個投資組合的總體均值，以及那個常數 k；而 k 本身又是你上一篇見過的兩個量之比——過程變異數的期望，與假設均值的變異數。一個純粹主義者會從外部信念裡把這些供出來。可這種信念又能從哪裡來呢？對一位盯著一座龐大資料庫的精算師來說，誠實的回答是：從資料本身把它們估計出來。這一步——用投資組合去估計那個隨後又拿來評判投資組合的先驗——就叫經驗貝氏。

這個想法樸實得令人欣喜，而它正是信度直接插回統計學那一階的接口。你有數以百計的投保人，每人都有那麼幾年的資料。這座資料庫裡，兩種變異在互相推搡。在單個投保人內部，理賠逐年純粹靠運氣上下蹦跳——這種散布在所有人身上平均一下，就估計出了過程變異數的期望。在不同投保人之間，那些長期的平均值是真切地有差別的，因為各人承擔的風險不同——這種各人平均值的分散，就估計出了假設均值的變異數。前者是雜訊，後者是訊號。經驗貝氏信度把兩者都直接從資料裡抽出來，不需要任何先驗信念。

估計投資組合均值——把所有投保人、所有年份的理賠取一個總平均。這就是新人、以及資料稀薄者會被拽向的那個標準費率。
估計過程變異數的期望——把每位投保人內部逐年的散布做個平均。這就是那種純粹的雜訊，它讓任何一個人的紀錄都成了不可靠的證人。
估計假設均值的變異數——在把上面那層雜訊扣掉之後，各人長期平均值彼此究竟差了多少。這才是真正的、風險與風險之間的訊號。
把 k 構造為這個比值（過程變異數除以均值的變異數），再為每位投保人算 Z = n /（n + k），最後把他自己的平均值和投資組合均值摻起來。整台信度機器，如今全靠你早就握在手裡的那些資料運轉。

幾句誠實告誡，以及回到統計學的那條線索

請留意這個迴路收得有多麼齊整。那些結構性的量，是用一種與統計學那一階裡的動差估計極為相近的辦法估出來的——讓觀測到的散布對上理論變異數，再解出來。而貝氏保費是一個後驗均值，是機率論裡貝氏定理的造物。信度並不是一座自成一體的怪島；它就是機率與統計，被用到了那個讓保險公司魂牽夢縈的唯一問題上——該在多大程度上信任稀薄的資料——再裹上保費與投資組合這套工作語言。你早先一級級爬上來的數學，正是通向這間屋子的那架梯子。

於是這一階在它暗中起步的地方畫上了句點。開篇那幾篇立起了問題——稀薄的資料對陣寬泛的平均——並給出一個便利得幾乎過了頭的加權答案。貝氏視角解釋了這個答案為何是對的；共軛的卜瓦松-伽瑪情形讓你看到它精確地對；經驗貝氏則展示了當（一如既往地）沒人遞給你一個先驗時，該如何讓整套裝置照常運轉。你要帶走的，是一種比公式活得更久的思維習慣：永遠別全然信任一個小樣本，也永遠別全然無視它，並讓投資組合的廣度，去定下兩者之間的那個匯率。