决策变成“策略性”的那一刻
到目前为止,你在这个领域里做的一切,悄悄地说,都是一项单人活动。一位消费者拿自己的满足感去权衡自己的预算。一家完全竞争里的企业,只是从牌子上读出市场价、再选个数量。哪怕是一家独占市场的垄断者,也只需查阅它自己的需求曲线。每一种情形里,你都能靠死盯着*你自己*的数字找到最佳选择。没有人回望着你。
现在想象同一个街角上的两家加油站。如果你降价,你的对手可能也跟着降——把你本想抢来的顾客一笔勾销。如果你涨价,她可能按兵不动,把你整条街的客人都接走。突然之间,没有哪个“最佳价格”是你能孤立地算出来的,因为“我该怎么做?”的正确答案是“看她怎么做”——而她的答案又反过来取决于你。这种循环往复、彼此对视的情形,正是经济学家所说的博弈,对它的正式研究就是博弈论。
三种材料:参与者、策略、收益
每一场博弈,无论宏大还是琐碎,都由同样的三种博弈要素搭成。第一,参与者:做决定的人——两家加油站、两个国家、两个室友。第二,每位参与者的策略:他们可选行动的完整清单,从“标价 1.5 元”到“造导弹”再到“今晚洗碗”。第三,收益:在选择的*每一种可能组合*下,每位参与者所得到的分数,它刻画了他们对每个结果有多在乎。
收益是其中微妙的那一个,值得多停留一会儿。收益并不只是钱。它是一个数字,代表一位参与者对某个结果所看重的一切——利润,没错,但也包括声望、生存、公平,或者一份清静。这跟前几个阶梯里的效用是同一个把戏:把一个人的所有欲求压缩成单一分数,好让我们能问他偏好哪个结果。而关键在于,你的收益通常同时取决于*双方*的选择。这正是为什么,你不先设想对方的策略,就没法选定自己的策略。
收益矩阵:一张网格容纳整场博弈
当两位参与者各有两个策略时,我们可以把整场博弈摆在一张叫收益矩阵的小网格上。一位参与者的策略标在行上,另一位的标在列上,四个格子里每一个都装着一*对*收益——每位参与者各一个数——对应那种选择组合。现在就该把读它养成习惯,因为收益矩阵是这整个阶梯的主力工具。我们就给两家加油站搭一张,它们各自只在“高价”和“低价”之间二选一。
Station B
High price Low price
+------------+------------+
High price | 10 , 10 | 2 , 14 |
Station A +------------+------------+
Low price | 14 , 2 | 5 , 5 |
+------------+------------+
In each cell: (A's payoff , B's payoff) = daily profit, $000s
If both go High: 10 each. If both go Low: 5 each.
If A undercuts (Low) while B stays High: A gets 14, B gets 2.把左下角那格当作一道范例来读:A 选低价、B 选高价,于是 A 赢下价格战、赚到 14(千元日利润),而 B 守着高价却没了顾客,只赚到 2。对角线才道出真正的故事。友好的结果——双方都高价、各赚 10——对*双方*都好过那个你死我活的结果——双方都低价、各赚 5。可看看是什么在诱惑每一位参与者:无论 B 怎么做,A 选低价都赚得更多(B 高价时 14 胜 10;B 低价时 5 胜 2)。这张矩阵已悄悄装下了一个两难,接下来的几篇会把它层层揭开。
读懂矩阵,并初尝那套逻辑
想清楚这样一张网格有个简单办法,它正是策略推理的核心:设身处地站到每位参与者的位置上,问一句:“对手每一种可能的做法,我各自的最佳回应是什么?”老老实实这么做,规律便会跳出来。在加油站博弈里,无论 B 怎么选,A 的最佳回应都是低价。当某一个策略,在对方每一种可能的行动面前都胜过其他所有备选时,它就被称为占优策略。
- 选定一位参与者,假装成他,完全无视另一方的收益数字。
- 假设对手出第一种策略。在那一列(或那一行)里扫一遍你自己的收益,标出你的最佳回应。
- 对对手的另一种策略再来一遍:同样找出你那唯一的最佳回应。
- 如果同一个回应两次都胜出,你就找到了一个占优策略。现在换边,为另一位参与者把这一切重做一遍。
把这套程序在两家加油站身上各跑一遍,你会发现它们*各自*都有“低价”这个占优策略。于是双方都理性地降了价,落进右下角那格,各赚 5——尽管左上角那格本可让它们各赚 10。一对策略,若彼此都是对方的最佳回应,以至于在别人既定的做法之下谁都不后悔自己的一步,就是一个纳什均衡。这里的均衡正是那个令人沮丧的 5 比 5。这套自我挫败的逻辑就是著名的囚徒困境,把它认认真真讲清楚,是下一篇的活儿。
为什么经济学有那么多东西暗地里是一场博弈
这可不是专为加油站准备的客厅小把戏。回想上一阶梯里那块缺失的拼图:寡头垄断,一个只有寥寥几家大企业的市场。不同于孤零零的垄断者,也不同于完全竞争里的芸芸众生,寡头的利润系于对手的动作——这正是相互依赖,也正因如此,供需那套机器在寡头身上悄悄失灵了。博弈论恰恰是为应对它而打造的工具:你刚读过的那个价格博弈,*就是*寡头问题的微缩版。
一旦握住这副镜片,你就会处处看见博弈。两个国家纠结要不要造武器,面对的矩阵形状跟我们的加油站一模一样——双方都宁愿裁军,可各自又怕成了唯一裁军的那个,于是双双扩军:一场军备竞赛。一个工会和一个雇主就工资讨价还价,各自掂量要硬撑还是要让步,这就是在进行一场博弈。企业决定要不要打广告、渔民共用一片日渐枯竭的渔场、政府选择关税,也都是。凡是你的最佳行动会随别人弯折之处,那三种材料就潜伏在那里。
在我们继续深入之前,有一句诚实的告诫。收益矩阵里那些利落的数字是一个模型,而非一次测量——它们假定每位参与者都知道收益、能前后一致地给结果排序,并冷静地推向最佳回应。真实的人会误判别人看重什么,会出于怨恨或信任而行动,也几乎不会眼前摆着一张整齐的网格。和这个领域里每一个经济模型一样,矩阵的价值,在于厘清一种处境的*逻辑*——为什么裁军让人觉得如此危险——而不在于把某个具体决定精确预测到分毫。这样去用,它便是你将遇到的最富启发的观念之一。