累積損失：集體風險模型

從兩塊拼圖到一個總數

本階到目前為止的一切，都活在那條偉大的頻率—強度分界線的某一側。你學會了為理賠*多久*來一次建模——也就是頻率分布，通常是一個卜瓦松計數；又另起一攤，為每一筆理賠*有多大*建模——也就是強度分布，一個正值、重尾的金額。兩個乾淨的小模型，安放在兩個乾淨的小盒子裡。可是，從來沒有哪家保險公司為一個「頻率」開過支票。它真正付出去的，是累積損失：一年裡每一筆理賠加總起來的那個大總數。這個唯一的隨機數，正是本篇要談的。

把這個總數記作 S。用大白話說：S 是 N 筆單獨理賠金額 X1、X2、…… 的和，其中 N 本身是隨機的（你事先並不知道今年會來多少筆理賠），而每一個 Xi 也是隨機的。兩顆骰子同時在滾——理賠的*數目*，以及每一筆的*大小*。正是這份雙重的隨機性，讓 S 比你迄今處理過的任何東西都更豐富，也更棘手。它是每一筆產險與意外（P&C）險保費、每一個資本數字、每一項再保險決策最終所倚靠的那個對象。

兩種加總的方式：個體模型與集體模型

要建出 S 的分布，有兩條誠實的路，它們回答的問題略有不同。個體風險模型逐張保單地走。對組合裡 n 份合約中的每一份，它都問：*這一張*保單會出險嗎？若出險，有多大？然後把這 n 個可能為零的金額加起來。對於一個保單數目固定、且大多數保單什麼都不報的帳冊來說，這是最自然的圖景——團體壽險就是經典例子：一份已知的名單，名單上每個人在這一年裡要麼身故、要麼沒有。

集體風險模型則不再盯著單張保單，而是把整個組合看作一台單一的「理賠生產機」。它不在乎是哪張保單觸發的；它只問：這本*帳冊*總共生產了多少筆理賠 N，每一筆又有多大？這就是集體視角，而 S = X1 + … + XN 配上一個隨機的 N，正是它的標誌性形態。對於一個龐大且不斷翻騰的組合——汽車每天都在投保和退保——這遠比逐張追蹤保單來得自然。你很少能確知究竟哪輛車會出事；但你能把整個車隊會出多少次事，建模得相當好。

留意這筆交易。個體模型對組合的構成是精確的，卻笨拙難算——要回答 n 個分開的「出不出、出多少」的問題。集體模型扔掉了保單的標籤，換回來的是巨大的數學便利；正是這份便利，才有了下一節的存在。關鍵在於：對一本大帳冊而言，兩者給出的 S 幾乎一模一樣，因為大數定律把差異抹平了。集體模型是你睜著眼睛選下的一個近似，而不是你偷工減料抄的一條近路。

複合卜瓦松模型，及它兩個乾淨的答案

集體模型最受寵的版本，把計數 N 取為卜瓦松分布。這就是複合卜瓦松模型：一個卜瓦松數目的理賠，每一筆都是從同一個強度分布裡獨立抽出的。「複合」無非是指：隨機數目的隨機塊件疊在一起——由此得到的 S 的分布，是一個複合分布。它幾乎是所有產險與意外險風險理論預設的起點，而它配得上這個位置，靠的是它對許多險種既貼近現實、又出奇地易於概括。

回報來了，而它是整個領域裡最漂亮的結果之一。你並不需要完整的分布，就能拿到你最想要的那兩個數。總損失的均值，不過就是平均次數乘以平均每筆金額——這是直覺上一眼可見的：期望的理賠筆數，每筆花費期望的金額。變異數才是那個微妙的，而正是在這裡，雙重隨機性的魔法顯露了出來。

Compound Poisson, with lambda = expected # claims:

  E[S]   = lambda * E[X]          (mean count x mean severity)
  Var[S] = lambda * E[X^2]        (count x second moment of severity)

Example: lambda = 100 claims/year
         severity mean E[X]    = 2,000
         severity E[X^2]       = 20,000,000  (so Var[X]=16,000,000)

  E[S]   = 100 x 2,000          = 200,000
  Var[S] = 100 x 20,000,000     = 2,000,000,000
  SD[S]  = sqrt(2,000,000,000)  = 44,721

兩條公式扛起了實務中的大部分擔子。變異數用的是二階矩 E[X^2]，而不只是強度的變異數——單單這一個事實，就抓住了一點：撐起總損失波動的，是大額理賠，而不只是頻繁的理賠。

在你愛上這些公式之前，有兩條誠實的告誡。第一，均值和變異數*並不是*分布本身。在我們的例子裡 E[S] 是 200,000、標準差約 44,700——可 S 是右偏的，所以壞年份向均值上方伸出去的距離，遠比好年份向下方落的要長。定價與資本，住在那條右尾裡，而不在均值上。第二，這些乾淨的公式倚賴獨立性：假設理賠不會扎堆。一場冰雹一次觸發一千筆彼此相關的屋頂理賠，會把這條假設狠狠打破——這也正是為什麼巨災風險要單獨建模，而不是硬塞進一個齊整的複合卜瓦松裡。

拿到整條分布：用大白話講 Panjer 遞推

當你面對的問題住在尾部時，均值和變異數就不夠用了：「我們的總損失會有多大，大到每兩百年才超過一次？」要回答這個，你需要 S 的完整分布，而這是真正的難題——把*隨機*數目的隨機理賠加起來，不是哪一條公式能一舉解決的和。在電腦出現之前，精算師靠中央極限定理來假裝 S 是常態的，可這個近似在右尾裡撒了大謊，而那恰恰是最要緊的地方。

**Panjer 遞推**是那條優雅的脫身之路。它是一種精確、對電腦友善的辦法，一格一格地建出 S 的分布——總損失等於 0 的機率，再到等於 1 個單位、2 個單位…… 的機率，每一步都踩著已經算出的答案往上爬。你沿著可能總損失的階梯往上走，遞推會告訴你，如何從下方那些格子精確地算出下一格的機率。不用模擬，不用常態曲線來糊弄：只是一場誠實的、機械的攀爬。

有一個值得點名的前提。這條遞推只有當頻率分布屬於一個特殊、性情溫良的家族時才管用——那就是 (a,b,0) 類，其成員恰好就是卜瓦松、負二項與二項分布；還有一個稍大些的 (a,b,1) 類，它另外能處理一個被調整過的「零理賠機率」。這並不是一個狹窄的籠子；那些正是精算師真正在用的計數分布。這條遞推還需要先把強度放到一張離散網格上——把理賠金額四捨五入到最近的單位，比如最近的 100——這會引入一個小而可控的離散化誤差，作為換取那條精確遞推的代價。

這條分布接下來把你帶向何方

一旦你能產出 S 的分布，你就握住了風險理論大半的萬能鑰匙，三扇門隨之打開。第一扇是定價：每張保單的期望累積損失，就是純保費——在加上任何費用或利潤附加之前，那份保障在精算上公允的成本。第二扇是資本：從右尾上讀出一個高分位數——你每兩百年才會超過一次的那個損失——你就得到了一個風險值（VaR）。把那一點之外的一切取平均，你就得到那個更溫和、把整條尾巴看得更全的尾部風險值（TVaR），它正是現代經濟資本的基礎。

在這扇門口要留心一個著名的誤解：VaR 告訴你那個每兩百年突破一次的*門檻*，卻對*一旦突破之後*會糟到什麼地步隻字不提。一場剛好越過門檻的風暴，和一場大上十倍的風暴，在 VaR 眼裡長得一模一樣——它無視那條遠尾。正是這個盲點，使得對突破本身的嚴重程度取平均的 TVaR，在償付能力監管框架裡穩步取代了它。還有一句貫穿整個本階的提醒：從 S 算出的準備金，並不是一筆擱著等花的閒錢——它是一份關於尚未完全顯露的損失、經過度量的承諾。

第三扇門，徑直通往階梯接下來的幾級。把保費流入減去損失流出的滾動餘額沿時間追蹤下去，S 就動了起來：你得到了破產理論裡的盈餘過程，去問保險公司的盈餘有多大可能在某一刻跌破零。而當你一開口問「我該多大程度上信任*這本*組合自己的損失經驗、相對於更廣闊的市場？」時，你就已經踏進了可信度問題——把一個群體的資料與更寬泛的資訊糅合起來，這正是你緊接著會遇見的念頭。集體風險模型不是一個終點；它是定價、資本、破產與可信度全都交匯的那個路口。