风险度量：VaR 与尾部 VaR

从一句话到一个数字

本阶梯的第一篇，把董事会的活儿交到了你手上：陈明一份风险胃纳——公司愿意承受多大的失败机会——并让这份陈述统辖整张资产负债表。可是“我们容忍一年里两百分之一”是一句话，而资产负债表靠的是数字。风险度量就是那台机器，把这句话化作一个数：把明年损失的整条概率分布喂给它，它便返回那条分布*值得操心*的那笔金额。把这把尺挑好，你持有的资本便兑现了承诺；挑坏了，你可以符合字面，却背叛了它的本意。

严格说来，风险度量不过是一个函数：它收下一个随机损失，吐出一个实数——给不确定性贴上一张价签。它的精神你在上个阶梯已经领教过，那时你把破产理论倒着跑，去找一层所需的缓冲。如今的不同在于高度：那里，是单一条业务、单一个盈余过程；这里，是整个企业的*每一项*风险卷成一条损失分布，再用一把尺度量它的全部。本篇要搭起的两把尺——VaR 与尾部 VaR——正是整个受监管的世界真正在为之争论的两把。

风险价值：悬崖边缘的高度

风险价值回答一个利落的问题：*在给定的概率、给定的时段内，我不会超过的那笔损失是多少？*挑一个置信水平——比如 99.5%——和一年。99.5% 的 VaR，就是这样一个损失数字：两百年里有一百九十九年，实际损失都落在它*之下*。它说白了就是损失分布的一个百分位：把所有可能的结果从最好排到最坏，沿着走到 99.5% 的位置，读出站在那里的数。那个数，便是悬崖边缘的高度——一个“寻常”坏年份里最糟的损失，恰好就在事态滑入罕见而巨灾的那一刻之前。

VaR 成为监管的通用语言，有充分的理由。它直观——一位毫无统计学功底的董事，也能领会“两百年里有一百九十九年我们不会突破的那笔损失”。它把整条分布坍缩成一个可比较的数。而它又能干净地对应到一条偿付能力规则：持有等于 99.5% VaR 的资本，纸面上你这一年就有了两百分之一被压垮的机会。最后这句话，恰恰就是偿付能力 II 这类框架下经济资本的定义方式——监管的资本目标*本身就是*一个 VaR，其置信水平选得正好对上董事会陈明的胃纳。

盲点：VaR 从不往边缘外看

危险就在这里，而轻看它会是致命的。VaR 告诉你悬崖的边缘*在哪里*。它对你一旦越过之后会跌得多深，只字不提——一个字都没有。99.5% 的 VaR，是关于那一百九十九个好年份的陈述；它对那一个坏年份究竟要花多少代价，完全缄默。按其构造，它无视了百分位之外的整条尾部。两家公司可以报出*一模一样*的 VaR，而其中一家在最糟的那 0.5% 的年份里损失的是尚可挺过的数额，另一家损失的却是其全部资本的十倍。VaR 分辨不出这两者。

这绝非吹毛求疵——它恰恰正是保险风险所栖身之处。回想破产理论里的那一课：在重尾严重度之下——巨灾、责任、大额火灾、网络风险——灾难是以单单一笔巨额理赔的形式降临的，端坐在 VaR 拒绝去看的那片极远区域里。这把尺，曾臭名昭著地被归咎于让银行在 2008 年之前持有了过薄的资本：它们的 VaR 看上去温驯，只因模型假定了一条薄尾，而真正到来的损失，恰恰活在 VaR 被设计成要去无视的那部分分布里。把业务优化去贴合一条 VaR 限额，甚至可能*奖赏*一家公司，让它把风险藏到刚好越过截断点的地方——在那里，风险对报出来的数字毫无贡献，对真实的危险却贡献了一切。

尾部 VaR：灾难的平均值

补救之道，是去问一个更深的问题。别再问“边缘在哪里？”，而要问“*假定*我们已经越过边缘，平均而言它有多糟？”这便是尾部风险价值——又称条件尾部期望，或者，在连续分布里，称预期短缺（expected shortfall）。99.5% 的 TVaR，是*最糟那 0.5% 年份里损失的平均值*——是 VaR 抛掉的那整条尾部里一切结果的均值。VaR 读的是悬崖边缘的高度，TVaR 则越过边缘，报出那一跌的平均深度。按其构造，同一水平上 TVaR 总是至少与 VaR 一样大，通常还更大——二者之间的差距，正是一支测量尾部有多沉的温度计。

用一组小小的情景把它坐实——二十个等可能的结果，只有最糟的那寥寥几个才会咬人。设十九个年份损失都不大，唯独一年——那场巨灾——损失 1,000。95% 的 VaR（即二十分之一最糟的门槛）端坐在那个坏年份的*边缘*上，几乎读不出那 1,000。但 95% 的 TVaR 取的是最糟 5% 的平均——这里，正是那单单一个损失 1,000 的年份——于是它直直地盯着灾难看。把这场巨灾换成损失 5,000 的一年，VaR 可能纹丝不动，TVaR 却翻了五倍。TVaR *感受到了*这个变化；VaR 对它视而不见。整套论证，尽在这一例之中。

20 equally likely yearly losses, sorted worst-first:

  Year:   1     2      3 ... 20
  Loss:  1000   90    80 ...  5     (only year 1 is the catastrophe)

  95% VaR  = threshold at the worst 1-in-20  = ~90   (edge of the bad year)
  95% TVaR = mean of the worst 5% (= worst 1) = 1000  (the catastrophe itself)

  Now make the catastrophe 5000 instead of 1000:
  95% VaR  ~= 90    (UNCHANGED  -- blind to the tail)
  95% TVaR  = 5000  (x5  -- it averages what is actually out there)

VaR 读边缘，TVaR 取那一跌的平均。只把巨灾加重，VaR 毫不动容，TVaR 却成倍上升——把那个盲点，化作了算术。

一致性：TVaR 为何赢得信任

TVaR 的优势，比“它会看尾部”更深一层。有一份简短的清单，列着任何一把*合理的*风险度量都应当遵守的性质，而一把全数遵守它们的尺，便称为一致风险度量。其中最要紧的是次可加性：两个组合合并后的风险，绝不应超过它们各自风险之和——把两本业务并到一起，不可能凭空*造出*危险，因为分散化只会有益，绝不会有害。这正是一家保险公司为何持有的资本少于其各部分之和的数学脊梁，也是整套分散化抵减的逻辑所在。

下面这句点睛之笔，定下了胜负：VaR *不*一致。它可以违反次可加性——确有真实的情形，把两个组合合并后，报出的 VaR 反而*上升*，仿佛分散化竟制造了风险。这不是个小怪癖；这是一桩逻辑上的荒谬，足以误导一家公司去拆分业务以操纵其资本，或去拒绝一桩本可让它真正更安全的分散化并购。TVaR 则相反，它*是*一致的：它永远次可加，于是分散化的算术永远指向正确的方向。原来，往尾部里看、与尊重分散化，竟是同一种美德，而 TVaR 二者兼备。

对两者都保持诚实

选 TVaR 而舍 VaR，修补了一处真实的缺陷，却买不来安全——它只买来一份关于危险栖身何处的诚实。两把尺都是从损失分布的一个*模型*里算出来的，而答案都被你最缺数据去钉牢的那条尾部所主宰。TVaR 的长处——它取整条尾部的平均——也正是它的脆弱：关于极远尾部如何行止的单单一条假设，便能让这个数字剧烈摆动；而 VaR 只盯着一个百分位，至少不会过度押注于一种它根本看不见的形状。两把尺都不是现实；它们都是你讲给现实的一个故事，而故事里最薄弱的那一章，永远是那个极端。

所以，把风险度量当作对话的*开端*，而绝非终点。单单一个数字——无论 VaR 还是 TVaR——是一份摘要，而任何摘要都会丢掉信息。成熟的做法，是把它与那些直接探查尾部的工具配对：极值方法，尤其是接下来几篇要讲的压力测试与情景测试——它们追问的是“究竟是*哪一桩具体的*灾难会击垮我们，我们又能否挺过它？”，而非去信任一条拟合曲线上的单单一个百分位。度量告诉你模型认为你需要多少资本；压力测试则告诉你，那个模型是不是在骗你。