有限波動（經典）信度

一個目標樸素的古老想法

上一篇給你留下了一行乾淨的式子——信度加權估計，自身資料乘以 Z 加上基準乘以（1 減 Z）——以及一個揮之不去的問題：權重 Z 究竟從何而來？本篇給出歷史上的第一個答案。誕生於約 1914 年工傷補償費率釐定中的有限波動信度（又稱*經典*信度），是這門行業最早一次試圖用規則、而非憑直覺來釘死 Z 的嘗試。

它的目標刻意地樸素，而正是這份樸素，是理解後續一切的鑰匙。它並不試圖找出*最精確*的估計，它只對你自身的資料提一個要求：別讓估計值在各期之間跳動得太厲害。它的名字已經把話挑明——我們想*限制*所報數字的*波動*。其中的道理很人性、也很容易向監管者辯護：一筆每年都上躥下跳的保費，既不公平、又難以解釋，而且多半反映的是運氣而非訊號。所以規則大致是：「在不讓隨機雜訊把答案甩來甩去的前提下，盡量信任你自身的經驗。」

完全信度：多少資料才配得上完全信任

從容易的一端講起。假設你自身的資料多到雜訊幾乎消失殆盡——估計值幾乎不再擺動。那你大可令 Z = 1，丟開基準，直接報出自己的數字。你願意這麼做時所需的資料量，就是完全信度標準。它是你必須跨過的門檻；一旦跨過，你的資料便「完全可信」。

這道門檻從何而來？來自你事先做出的兩個選擇，外加你已經認識的中心極限定理。第一，一個*容差*：你希望觀測到的經驗落在其真實均值多近的範圍內——比如正負 5% 以內？第二，一個*機率*：你希望有多大頻率達到這種接近——比如 90% 的時間？中心極限定理告訴你，許多相互獨立觀測的平均值近似常態，於是它把這兩個選擇換算成一個所需的樣本量。對於服從卜瓦松模式的理賠次數，要把頻率估計到這般精度，需要約 (1.645 / 0.05) 的平方，算下來約為 1,082 次預期理賠。這個單一的數字——一千餘次理賠——就是著名的、關於頻率的經典完全信度標準。

Full-credibility standard for frequency (Poisson counts):

  N_full = ( z_p / k )^2
     z_p = normal score for the chosen probability p
     k   = chosen tolerance (relative)

  '90% within +/- 5%' :  z_p = 1.645,  k = 0.05
     N_full = (1.645 / 0.05)^2 = (32.9)^2  ~= 1,082 expected claims

  Demand more -> bar climbs fast:
  '99% within +/- 1%' :  N_full = (2.576 / 0.01)^2 ~= 66,400 claims

這個標準不過是把兩個判斷取捨放進常態曲線裡跑一遍。更緊的容差或更高的信賴度會讓它急劇膨脹——注意它從約 1,082 躍升到約 66,400。

兩條誠實的腳註。第一，那個 1,082 *只*管頻率——如果每筆理賠的*金額*也在變動（它總是在變），標準會上調以容納那份額外雜訊，常常上調得不少。第二，也更要緊的是，這裡沒有一樣東西是自然法則。把容差從 5% 改成 2.5%，或把信賴度從 90% 改成 95%，門檻就會移動。完全信度標準是一種被選定的約定——有時獲監管認可——而非關於世界的事實。兩位審慎的精算師，可以為同一組業務各自言之成理地選出不同的標準。

部分信度與平方根法則

正是這個隱患，讓信度成為一門每日的手藝，而非一樁奇談：現實中幾乎沒有哪本業務真能攢夠一千餘次理賠。一個車險地區、一家中型僱主的團體計畫、一款進入第三年的新產品——它們統統不夠。不夠，就意味著你的資料一文不值、必須徹底向基準繳械嗎？當然不是。在門檻之下，你贏得部分信度：一個嚴格介於 0 與 1 之間的分數權重 Z，並隨你資料的增長而增長。

經典信度用那條著名的平方根法則來設定這個分數權重：Z 等於（你實際擁有的資料，除以你達到完全信度所需的資料）的平方根，上限為 1。平方根正是其精髓所在——也常令初學者吃驚。如果你只有所需資料的*四分之一*，你的 Z 並不是四分之一；它是四分之一的平方根，也就是*二分之一*。權重沿一條曲線增長，而非直線，起初陡升，臨近完全信度時再漸漸放平。

為什麼是平方根，而不是更簡單的東西？因為平均值的隨機誤差按樣本量的平方根成比例縮小——正是你在大數定律那裡遇到的同一條平方根定律。要把雜訊*減半*，你需要*四倍*的資料。所以如果你按資料之比的平方根來設定 Z，部分可信估計裡剩下的那點擺動，便恰好滿足完全信度所分毫不差滿足的那同一個安全目標。這條法則不是隨意湊出來的擬合；它是那個波動目標，被一以貫之地帶到了完全信度門檻之下。

一個完整走通的例子

設想某車險公司的一個小地區。它有史以來產生了 270 次理賠；這個險種的完全信度標準是 1,082。它自身的資料說每輛車的損失成本是 850；而全國基準——它將朝之混合的那個*信度補集*——是 1,000。我們已經握有設定 Z、報出費率所需的一切。一步步走一遍。

把你的資料與門檻相比：你有 270 次理賠，而完全信度標準是 1,082，比值約為 0.25——走了四分之一的路。
套用平方根法則：Z = sqrt(270 / 1,082) = sqrt(0.25)，約為 0.50。資料只有四分之一，權重卻有一半。
用信度加權公式混合：費率 = 0.50 × 850 + 0.50 × 1,000 = 925，乾淨俐落地落在你自身成本與基準之間。

留意一下：一旦握住 Z，算術是多麼平淡無奇——整個信度因子 Z只在一次乘法裡就把活幹完了。現在看那條平方根曲線如何咬人。要把這個地區的 Z 從 0.50 推高到體面的 0.75，你需要的不是多出 50% 的資料；你需要把它*翻一倍有餘*，到約 608 次理賠，因為 0.75 的平方乘以 1,082 約等於 608。而要夠到完全信度，你得攢滿全部 1,082——把當下的證據翻四倍，才能讓起初的權重翻一倍。信度是慢慢掙來的，而且越接近，掙得越慢。

它的魅力——以及那個不容迴避的盲點

經典信度何以歷經一個世紀而不衰，不難看出。它*透明*：監管者或保單持有人能跟上每一步。它*省事*：兩個判斷取捨加一個平方根，不需要繁重的估計。它*站得住腳*：「一旦你的資料穩定到十年裡有九年都落在真值的 5% 以內，我們就信任它」——這是任何人都能領會的一句話。它至今仍嵌在世界各地的費率手冊與監管公式裡，而對許多業務而言，它就是夠用了。

可現在，是這門行業欠自己的那份誠實了。把我們做過的一切回頭讀一遍，留意一樣自始至終不曾露面的東西：任何衡量*這個地區與全國平均究竟有多不同*的尺度。經典信度只向內看，盯著你自身資料裡的雜訊，並把基準當成對你而言恰好正確、可供退守的東西。它從不追問那個全國的 1,000 是否哪怕接近這個地區的真實成本。Z 完全由*你自身經驗的變異數*構成——從不取決於風險之間真實的離散。

那唯一缺失的成分——一把衡量風險間真實差異的尺子——正是下一篇要補上的。Bühlmann 信度把風險*內部*的雜訊，與風險*之間*真實的離散相互權衡，並從這份權衡裡導出一個 Z，它的目標不只是限制波動，而是盡可能精確。經典信度是那份誠實、直觀的初稿；Bühlmann 則是有原則的修訂。你正是要先有了前者，才能真正欣賞後者。