JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

貝氏視角與經驗貝氏

Bühlmann 把信度權重作為一個巧妙的猜測交到你手上;而貝氏則揭示:它從一開始就是那個正確答案。緊接著登場的,是讓整台機器靠真實資料運轉起來的訣竅——從投資組合本身把先驗估計出來。

信度,原來是喬裝打扮的貝氏定理

到現在,信度公式已經讓你覺得眼熟:把投保人自己的經驗跟投資組合的平均值摻在一起,給個人資料配上權重 Z、給平均值配上權重(1 減 Z)。前面幾篇用兩種方式為 Z 尋找理由——先是要求資料足夠穩定(有限波動),再是把平方誤差最小化(Bühlmann 信度)。兩條路幾乎都憑著工程師的直覺,落到了一個加權平均上。本篇要揭示更深一層的真相:這個摻和並不是某種近似、也不是什麼巧妙的啟發式做法。對一大類既寬廣又重要的模型而言,它恰恰就是機率法則所要求的那個答案。信度,正是披著精算師外套的貝氏更新

回想機率論那一階裡的貝氏定理。它是一條在證據面前改變想法的規則。你先有一個先驗——在看到這位投保人的資料之前,你對某個未知量所持的信念。這裡的未知量,是這位投保人自己真實的風險水平——記作 θ——它對你是隱藏的,因為風險本就看不見。這個先驗,是整個投資組合教給你的東西:θ 在一個又一個客戶之間是如何變化的。接著,這位客戶產生了一些理賠,這便是證據。貝氏定理機械地把先驗和證據合成一個後驗——也就是當你觀察這個人一段時間之後,對他那個 θ 所持的、更新過的信念。

看看這個後驗究竟是什麼。先驗以投資組合的平均值為中心——那正是每個新人起步時所用的標準費率。證據則把估計往客戶自己觀測到的經驗上拽。後驗最終落在兩者之間的某處:當你的資料很多時它偏向資料,當資料很少時它偏向先驗。這恰恰就是那個信度摻和。所以貝氏信度並不是你已經學過的東西的對手——它是那些東西的根基。你之前算出來的那個 Z,一直都是後驗在悄聲說話。

乾淨俐落的共軛故事:卜瓦松遇上伽瑪

貝氏定理是誠實的,但一般而言它是一場算術噩夢——後驗是一個積分,極少有整潔的形式。然而存在一對魔法般的搭配,能讓它始終保持簡單;它之所以是教科書裡的範例,正是因為這是你能徒手算出來的那一個。把每位投保人的年度理賠次數建模為參數是其個人比率 θ 的卜瓦松分布。放眼整個投資組合,這些 θ 值本身是變動的,我們用一個伽瑪分布作為先驗來刻畫這種分散。伽瑪正是為了與卜瓦松概似相配而塑造出來的先驗,二者天生一對。

下面是那個小小的奇蹟。當先驗是伽瑪、資料是卜瓦松時,後驗又是一個伽瑪——還是同一個家族,只是參數更新了。一個其形態能像這樣在更新中倖存下來的先驗,就叫共軛先驗;而卜瓦松資料的共軛先驗,恰恰就是伽瑪。這個更新簡單得近乎荒唐:伽瑪的兩個參數常被暱稱為「形狀」和「速率」。要得到後驗,你把觀測到的理賠總數加到形狀上,把觀察的年數加到速率上。整個計算就這些——加法而已。

Prior belief about a driver's true rate theta:  Gamma(shape=3, rate=2)
   prior mean = shape / rate = 3 / 2 = 1.5 claims per year  (the manual rate)

Observe this driver for 4 years: 2 + 1 + 0 + 1 = 4 claims total

Posterior  = Gamma(shape + claims, rate + years)
           = Gamma(3 + 4, 2 + 4) = Gamma(7, 6)
   posterior mean = 7 / 6 = 1.167 claims per year   <- the new premium rate

It is a credibility blend:  1.167 = Z * (own rate) + (1-Z) * 1.5
   own observed rate = 4 claims / 4 years = 1.0
   1.167 = Z*1.0 + (1-Z)*1.5  ->  Z = 4 / (4 + 2) = 0.667
   Z = years / (years + rate-parameter)  <- exactly the Buhlmann form, k = 2
卜瓦松-伽瑪後驗均值,就是信度保費本身:給自己的經驗配上權重 Z = 年數/(年數+k),其餘配給先驗。沒有任何近似——Bühlmann 的線性摻和,在這裡就是精確的貝氏答案。

盯著這些算出來的數字,關鍵的那一擊就落了下來。後驗均值 1.167,字面上就是這位司機自己的比率(1.0)與標準費率(1.5)的一個加權平均,權重 Z = 0.667——而這個 Z 等於年數除以(年數加上一個常數)。那個常數不是別的,正是 Bühlmann 的信度常數 k。於是,精確的貝氏保費與近似的 Bühlmann 信度保費並不只是接近而已;對卜瓦松-伽瑪模型,它們就是同一個數字。原來在這個情形裡,Bühlmann 那條線性捷徑,根本就不是什麼捷徑——它就是真相。

為什麼這要緊——以及它在哪裡不再精確

這種一致令人安心,但我們得誠實地說清楚為什麼 Bühlmann 仍然值得掌握。精確的貝氏後驗之所以這麼乾淨,只是因為先驗和概似恰好共軛。換上另一種理賠分布、或者一個不那麼配合的先驗,後驗就會變成一個沒有閉式解的積分,逼著你要麼做繁重的數值計算、要麼搞模擬。Bühlmann 的高明之處在於他索取得更少:他不求完整的後驗,只求對它最好的那條直線近似。這個線性估計對任何模型都只需幾個動差就能算出來;而在共軛的那些情形裡,它一分錢代價都不要你付,因為它恰好就是精確的。

這裡還有一個更微妙的誠實之處。整套貝氏故事都建立在先驗正確這一前提上——建立在伽瑪確實刻畫了風險在你客戶之間如何變化這件事上。如果先驗選得很糟,那麼無論湧入多少資料,後驗都會繼承這份缺陷(不過謝天謝地,足夠多的資料最終會把一個錯誤的先驗淹沒掉)。可是在實務中,一位剛入職的精算師,又能從哪裡弄來一個值得信賴的先驗?沒人是揣著一個先驗走進門的。這道鴻溝——一套優美的理論,卻需要一個你手上沒有的輸入——恰恰就是本篇最後那個想法要去填補的。

經驗貝氏:讓資料自己把先驗遞給你

現在來看實務上的窘境。貝氏這套配方需要一個先驗——對 Bühlmann 來說,那意味著兩個結構性的數字:整個投資組合的總體均值,以及那個常數 k;而 k 本身又是你上一篇見過的兩個量之比——過程變異數的期望,與假設均值的變異數。一個純粹主義者會從外部信念裡把這些供出來。可這種信念又能從哪裡來呢?對一位盯著一座龐大資料庫的精算師來說,誠實的回答是:從資料本身把它們估計出來。這一步——用投資組合去估計那個隨後又拿來評判投資組合的先驗——就叫經驗貝氏

這個想法樸實得令人欣喜,而它正是信度直接插回統計學那一階的接口。你有數以百計的投保人,每人都有那麼幾年的資料。這座資料庫裡,兩種變異在互相推搡。在單個投保人內部,理賠逐年純粹靠運氣上下蹦跳——這種散布在所有人身上平均一下,就估計出了過程變異數的期望。在不同投保人之間,那些長期的平均值是真切地有差別的,因為各人承擔的風險不同——這種各人平均值的分散,就估計出了假設均值的變異數。前者是雜訊,後者是訊號。經驗貝氏信度把兩者都直接從資料裡抽出來,不需要任何先驗信念。

  1. 估計投資組合均值——把所有投保人、所有年份的理賠取一個總平均。這就是新人、以及資料稀薄者會被拽向的那個標準費率。
  2. 估計過程變異數的期望——把每位投保人內部逐年的散布做個平均。這就是那種純粹的雜訊,它讓任何一個人的紀錄都成了不可靠的證人。
  3. 估計假設均值的變異數——在把上面那層雜訊扣掉之後,各人長期平均值彼此究竟差了多少。這才是真正的、風險與風險之間的訊號。
  4. 把 k 構造為這個比值(過程變異數除以均值的變異數),再為每位投保人算 Z = n /(n + k),最後把他自己的平均值和投資組合均值摻起來。整台信度機器,如今全靠你早就握在手裡的那些資料運轉。

幾句誠實告誡,以及回到統計學的那條線索

請留意這個迴路收得有多麼齊整。那些結構性的量,是用一種與統計學那一階裡的動差估計極為相近的辦法估出來的——讓觀測到的散布對上理論變異數,再解出來。而貝氏保費是一個後驗均值,是機率論裡貝氏定理的造物。信度並不是一座自成一體的怪島;它就是機率與統計,被用到了那個讓保險公司魂牽夢縈的唯一問題上——該在多大程度上信任稀薄的資料——再裹上保費與投資組合這套工作語言。你早先一級級爬上來的數學,正是通向這間屋子的那架梯子。

於是這一階在它暗中起步的地方畫上了句點。開篇那幾篇立起了問題——稀薄的資料對陣寬泛的平均——並給出一個便利得幾乎過了頭的加權答案。貝氏視角解釋了這個答案為何是對的;共軛的卜瓦松-伽瑪情形讓你看到它精確地對;經驗貝氏則展示了當(一如既往地)沒人遞給你一個先驗時,該如何讓整套裝置照常運轉。你要帶走的,是一種比公式活得更久的思維習慣:永遠別全然信任一個小樣本,也永遠別全然無視它,並讓投資組合的廣度,去定下兩者之間的那個匯率。