JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

有限波動(經典)信度

對「我該多大程度信任自己的資料」這個問題,最早、也最直觀的答案是:在安全範圍內盡量信任它,而「安全」意味著它不會跳動得太厲害。來認識完全信度標準、平方根法則,以及它們共有的、不容迴避的盲點。

一個目標樸素的古老想法

上一篇給你留下了一行乾淨的式子——信度加權估計,自身資料乘以 Z 加上基準乘以(1 減 Z)——以及一個揮之不去的問題:權重 Z 究竟從何而來?本篇給出歷史上的第一個答案。誕生於約 1914 年工傷補償費率釐定中的有限波動信度(又稱*經典*信度),是這門行業最早一次試圖用規則、而非憑直覺來釘死 Z 的嘗試。

它的目標刻意地樸素,而正是這份樸素,是理解後續一切的鑰匙。它並不試圖找出*最精確*的估計,它只對你自身的資料提一個要求:別讓估計值在各期之間跳動得太厲害。它的名字已經把話挑明——我們想*限制*所報數字的*波動*。其中的道理很人性、也很容易向監管者辯護:一筆每年都上躥下跳的保費,既不公平、又難以解釋,而且多半反映的是運氣而非訊號。所以規則大致是:「在不讓隨機雜訊把答案甩來甩去的前提下,盡量信任你自身的經驗。」

完全信度:多少資料才配得上完全信任

從容易的一端講起。假設你自身的資料多到雜訊幾乎消失殆盡——估計值幾乎不再擺動。那你大可令 Z = 1,丟開基準,直接報出自己的數字。你願意這麼做時所需的資料量,就是完全信度標準。它是你必須跨過的門檻;一旦跨過,你的資料便「完全可信」。

這道門檻從何而來?來自你事先做出的兩個選擇,外加你已經認識的中心極限定理。第一,一個*容差*:你希望觀測到的經驗落在其真實均值多近的範圍內——比如正負 5% 以內?第二,一個*機率*:你希望有多大頻率達到這種接近——比如 90% 的時間?中心極限定理告訴你,許多相互獨立觀測的平均值近似常態,於是它把這兩個選擇換算成一個所需的樣本量。對於服從卜瓦松模式的理賠次數,要把頻率估計到這般精度,需要約 (1.645 / 0.05) 的平方,算下來約為 1,082 次預期理賠。這個單一的數字——一千餘次理賠——就是著名的、關於頻率的經典完全信度標準。

Full-credibility standard for frequency (Poisson counts):

  N_full = ( z_p / k )^2
     z_p = normal score for the chosen probability p
     k   = chosen tolerance (relative)

  '90% within +/- 5%' :  z_p = 1.645,  k = 0.05
     N_full = (1.645 / 0.05)^2 = (32.9)^2  ~= 1,082 expected claims

  Demand more -> bar climbs fast:
  '99% within +/- 1%' :  N_full = (2.576 / 0.01)^2 ~= 66,400 claims
這個標準不過是把兩個判斷取捨放進常態曲線裡跑一遍。更緊的容差或更高的信賴度會讓它急劇膨脹——注意它從約 1,082 躍升到約 66,400。

兩條誠實的腳註。第一,那個 1,082 *只*管頻率——如果每筆理賠的*金額*也在變動(它總是在變),標準會上調以容納那份額外雜訊,常常上調得不少。第二,也更要緊的是,這裡沒有一樣東西是自然法則。把容差從 5% 改成 2.5%,或把信賴度從 90% 改成 95%,門檻就會移動。完全信度標準是一種被選定的約定——有時獲監管認可——而非關於世界的事實。兩位審慎的精算師,可以為同一組業務各自言之成理地選出不同的標準。

部分信度與平方根法則

正是這個隱患,讓信度成為一門每日的手藝,而非一樁奇談:現實中幾乎沒有哪本業務真能攢夠一千餘次理賠。一個車險地區、一家中型僱主的團體計畫、一款進入第三年的新產品——它們統統不夠。不夠,就意味著你的資料一文不值、必須徹底向基準繳械嗎?當然不是。在門檻之下,你贏得部分信度:一個嚴格介於 0 與 1 之間的分數權重 Z,並隨你資料的增長而增長。

經典信度用那條著名的平方根法則來設定這個分數權重:Z 等於(你實際擁有的資料,除以你達到完全信度所需的資料)的平方根,上限為 1。平方根正是其精髓所在——也常令初學者吃驚。如果你只有所需資料的*四分之一*,你的 Z 並不是四分之一;它是四分之一的平方根,也就是*二分之一*。權重沿一條曲線增長,而非直線,起初陡升,臨近完全信度時再漸漸放平。

為什麼是平方根,而不是更簡單的東西?因為平均值的隨機誤差按樣本量的平方根成比例縮小——正是你在大數定律那裡遇到的同一條平方根定律。要把雜訊*減半*,你需要*四倍*的資料。所以如果你按資料之比的平方根來設定 Z,部分可信估計裡剩下的那點擺動,便恰好滿足完全信度所分毫不差滿足的那同一個安全目標。這條法則不是隨意湊出來的擬合;它是那個波動目標,被一以貫之地帶到了完全信度門檻之下。

一個完整走通的例子

設想某車險公司的一個小地區。它有史以來產生了 270 次理賠;這個險種的完全信度標準是 1,082。它自身的資料說每輛車的損失成本是 850;而全國基準——它將朝之混合的那個*信度補集*——是 1,000。我們已經握有設定 Z、報出費率所需的一切。一步步走一遍。

  1. 把你的資料與門檻相比:你有 270 次理賠,而完全信度標準是 1,082,比值約為 0.25——走了四分之一的路。
  2. 套用平方根法則:Z = sqrt(270 / 1,082) = sqrt(0.25),約為 0.50。資料只有四分之一,權重卻有一半。
  3. 用信度加權公式混合:費率 = 0.50 × 850 + 0.50 × 1,000 = 925,乾淨俐落地落在你自身成本與基準之間。

留意一下:一旦握住 Z,算術是多麼平淡無奇——整個信度因子 Z只在一次乘法裡就把活幹完了。現在看那條平方根曲線如何咬人。要把這個地區的 Z 從 0.50 推高到體面的 0.75,你需要的不是多出 50% 的資料;你需要把它*翻一倍有餘*,到約 608 次理賠,因為 0.75 的平方乘以 1,082 約等於 608。而要夠到完全信度,你得攢滿全部 1,082——把當下的證據翻四倍,才能讓起初的權重翻一倍。信度是慢慢掙來的,而且越接近,掙得越慢。

它的魅力——以及那個不容迴避的盲點

經典信度何以歷經一個世紀而不衰,不難看出。它*透明*:監管者或保單持有人能跟上每一步。它*省事*:兩個判斷取捨加一個平方根,不需要繁重的估計。它*站得住腳*:「一旦你的資料穩定到十年裡有九年都落在真值的 5% 以內,我們就信任它」——這是任何人都能領會的一句話。它至今仍嵌在世界各地的費率手冊與監管公式裡,而對許多業務而言,它就是夠用了。

可現在,是這門行業欠自己的那份誠實了。把我們做過的一切回頭讀一遍,留意一樣自始至終不曾露面的東西:任何衡量*這個地區與全國平均究竟有多不同*的尺度。經典信度只向內看,盯著你自身資料裡的雜訊,並把基準當成對你而言恰好正確、可供退守的東西。它從不追問那個全國的 1,000 是否哪怕接近這個地區的真實成本。Z 完全由*你自身經驗的變異數*構成——從不取決於風險之間真實的離散。

那唯一缺失的成分——一把衡量風險間真實差異的尺子——正是下一篇要補上的。Bühlmann 信度把風險*內部*的雜訊,與風險*之間*真實的離散相互權衡,並從這份權衡裡導出一個 Z,它的目標不只是限制波動,而是盡可能精確。經典信度是那份誠實、直觀的初稿;Bühlmann 則是有原則的修訂。你正是要先有了前者,才能真正欣賞後者。