從兩塊拼圖到一個總數
本階到目前為止的一切,都活在那條偉大的頻率—強度分界線的某一側。你學會了為理賠*多久*來一次建模——也就是頻率分布,通常是一個卜瓦松計數;又另起一攤,為每一筆理賠*有多大*建模——也就是強度分布,一個正值、重尾的金額。兩個乾淨的小模型,安放在兩個乾淨的小盒子裡。可是,從來沒有哪家保險公司為一個「頻率」開過支票。它真正付出去的,是累積損失:一年裡每一筆理賠加總起來的那個大總數。這個唯一的隨機數,正是本篇要談的。
把這個總數記作 S。用大白話說:S 是 N 筆單獨理賠金額 X1、X2、…… 的和,其中 N 本身是隨機的(你事先並不知道今年會來多少筆理賠),而每一個 Xi 也是隨機的。兩顆骰子同時在滾——理賠的*數目*,以及每一筆的*大小*。正是這份雙重的隨機性,讓 S 比你迄今處理過的任何東西都更豐富,也更棘手。它是每一筆產險與意外(P&C)險保費、每一個資本數字、每一項再保險決策最終所倚靠的那個對象。
兩種加總的方式:個體模型與集體模型
要建出 S 的分布,有兩條誠實的路,它們回答的問題略有不同。個體風險模型逐張保單地走。對組合裡 n 份合約中的每一份,它都問:*這一張*保單會出險嗎?若出險,有多大?然後把這 n 個可能為零的金額加起來。對於一個保單數目固定、且大多數保單什麼都不報的帳冊來說,這是最自然的圖景——團體壽險就是經典例子:一份已知的名單,名單上每個人在這一年裡要麼身故、要麼沒有。
集體風險模型則不再盯著單張保單,而是把整個組合看作一台單一的「理賠生產機」。它不在乎是哪張保單觸發的;它只問:這本*帳冊*總共生產了多少筆理賠 N,每一筆又有多大?這就是集體視角,而 S = X1 + … + XN 配上一個隨機的 N,正是它的標誌性形態。對於一個龐大且不斷翻騰的組合——汽車每天都在投保和退保——這遠比逐張追蹤保單來得自然。你很少能確知究竟哪輛車會出事;但你能把整個車隊會出多少次事,建模得相當好。
留意這筆交易。個體模型對組合的構成是精確的,卻笨拙難算——要回答 n 個分開的「出不出、出多少」的問題。集體模型扔掉了保單的標籤,換回來的是巨大的數學便利;正是這份便利,才有了下一節的存在。關鍵在於:對一本大帳冊而言,兩者給出的 S 幾乎一模一樣,因為大數定律把差異抹平了。集體模型是你睜著眼睛選下的一個近似,而不是你偷工減料抄的一條近路。
複合卜瓦松模型,及它兩個乾淨的答案
集體模型最受寵的版本,把計數 N 取為卜瓦松分布。這就是複合卜瓦松模型:一個卜瓦松數目的理賠,每一筆都是從同一個強度分布裡獨立抽出的。「複合」無非是指:隨機數目的隨機塊件疊在一起——由此得到的 S 的分布,是一個複合分布。它幾乎是所有產險與意外險風險理論預設的起點,而它配得上這個位置,靠的是它對許多險種既貼近現實、又出奇地易於概括。
回報來了,而它是整個領域裡最漂亮的結果之一。你並不需要完整的分布,就能拿到你最想要的那兩個數。總損失的均值,不過就是平均次數乘以平均每筆金額——這是直覺上一眼可見的:期望的理賠筆數,每筆花費期望的金額。變異數才是那個微妙的,而正是在這裡,雙重隨機性的魔法顯露了出來。
Compound Poisson, with lambda = expected # claims:
E[S] = lambda * E[X] (mean count x mean severity)
Var[S] = lambda * E[X^2] (count x second moment of severity)
Example: lambda = 100 claims/year
severity mean E[X] = 2,000
severity E[X^2] = 20,000,000 (so Var[X]=16,000,000)
E[S] = 100 x 2,000 = 200,000
Var[S] = 100 x 20,000,000 = 2,000,000,000
SD[S] = sqrt(2,000,000,000) = 44,721在你愛上這些公式之前,有兩條誠實的告誡。第一,均值和變異數*並不是*分布本身。在我們的例子裡 E[S] 是 200,000、標準差約 44,700——可 S 是右偏的,所以壞年份向均值上方伸出去的距離,遠比好年份向下方落的要長。定價與資本,住在那條右尾裡,而不在均值上。第二,這些乾淨的公式倚賴獨立性:假設理賠不會扎堆。一場冰雹一次觸發一千筆彼此相關的屋頂理賠,會把這條假設狠狠打破——這也正是為什麼巨災風險要單獨建模,而不是硬塞進一個齊整的複合卜瓦松裡。
拿到整條分布:用大白話講 Panjer 遞推
當你面對的問題住在尾部時,均值和變異數就不夠用了:「我們的總損失會有多大,大到每兩百年才超過一次?」要回答這個,你需要 S 的完整分布,而這是真正的難題——把*隨機*數目的隨機理賠加起來,不是哪一條公式能一舉解決的和。在電腦出現之前,精算師靠中央極限定理來假裝 S 是常態的,可這個近似在右尾裡撒了大謊,而那恰恰是最要緊的地方。
**Panjer 遞推**是那條優雅的脫身之路。它是一種精確、對電腦友善的辦法,一格一格地建出 S 的分布——總損失等於 0 的機率,再到等於 1 個單位、2 個單位…… 的機率,每一步都踩著已經算出的答案往上爬。你沿著可能總損失的階梯往上走,遞推會告訴你,如何從下方那些格子精確地算出下一格的機率。不用模擬,不用常態曲線來糊弄:只是一場誠實的、機械的攀爬。
有一個值得點名的前提。這條遞推只有當頻率分布屬於一個特殊、性情溫良的家族時才管用——那就是 (a,b,0) 類,其成員恰好就是卜瓦松、負二項與二項分布;還有一個稍大些的 (a,b,1) 類,它另外能處理一個被調整過的「零理賠機率」。這並不是一個狹窄的籠子;那些正是精算師真正在用的計數分布。這條遞推還需要先把強度放到一張離散網格上——把理賠金額四捨五入到最近的單位,比如最近的 100——這會引入一個小而可控的離散化誤差,作為換取那條精確遞推的代價。
這條分布接下來把你帶向何方
一旦你能產出 S 的分布,你就握住了風險理論大半的萬能鑰匙,三扇門隨之打開。第一扇是定價:每張保單的期望累積損失,就是純保費——在加上任何費用或利潤附加之前,那份保障在精算上公允的成本。第二扇是資本:從右尾上讀出一個高分位數——你每兩百年才會超過一次的那個損失——你就得到了一個風險值(VaR)。把那一點之外的一切取平均,你就得到那個更溫和、把整條尾巴看得更全的尾部風險值(TVaR),它正是現代經濟資本的基礎。
在這扇門口要留心一個著名的誤解:VaR 告訴你那個每兩百年突破一次的*門檻*,卻對*一旦突破之後*會糟到什麼地步隻字不提。一場剛好越過門檻的風暴,和一場大上十倍的風暴,在 VaR 眼裡長得一模一樣——它無視那條遠尾。正是這個盲點,使得對突破本身的嚴重程度取平均的 TVaR,在償付能力監管框架裡穩步取代了它。還有一句貫穿整個本階的提醒:從 S 算出的準備金,並不是一筆擱著等花的閒錢——它是一份關於尚未完全顯露的損失、經過度量的承諾。
第三扇門,徑直通往階梯接下來的幾級。把保費流入減去損失流出的滾動餘額沿時間追蹤下去,S 就動了起來:你得到了破產理論裡的盈餘過程,去問保險公司的盈餘有多大可能在某一刻跌破零。而當你一開口問「我該多大程度上信任*這本*組合自己的損失經驗、相對於更廣闊的市場?」時,你就已經踏進了可信度問題——把一個群體的資料與更寬泛的資訊糅合起來,這正是你緊接著會遇見的念頭。集體風險模型不是一個終點;它是定價、資本、破產與可信度全都交匯的那個路口。