两名嫌疑人,两间上了锁的房间
在这一阶梯的第一篇里,你学过任何博弈都有的那些零件:参与者、各自能走的招数,以及记录每种招数组合下各人所得的收益矩阵。现在我们就用这些零件,去拆解一个具体而狡黠地简单的博弈——囚徒困境——因为它是整个领域里最有启发性的那一个故事。关于“合作为何如此之难”,策略所能教给我们的几乎一切,都藏在它里头。
经典的设定是这样的。两个同伙,阿达和阿本,被捕后分别关进两间房,彼此无法通话。检察官给每人开出同样的条件。如果你出卖同伙(认罪)而对方保持沉默,你当场无罪释放,对方判十年。如果你俩都沉默,检察官只能给你们各自定一个轻罪——每人一年。但如果你俩都出卖对方,则各判八年。每人都得独自决定,全然不知对方会怎么选。
在我们碰任何数字之前,先留意它那残忍的结构。*在一起*看,他俩最好的结果是都保持沉默——各判一年。可每个人私下里都被出卖所诱惑,因为出卖也许能让自己脱身。整出戏,就活在“对这一对人有利”与“对个体有诱惑”这两者之间的那道裂缝里。让我们把四种结局明明白白地摆出来,再一步步跟着每名囚徒的盘算往下走。
占优策略:无论对方怎么做,出卖都更划算
Years in prison (Ada's, Ben's) -- fewer is better
BEN stays silent BEN betrays
ADA stays silent 1 , 1 10 , 0
ADA betrays 0 , 10 8 , 8
Ada's view, reading down each of Ben's choices:
If Ben is SILENT: silent=1yr vs betray=0yr -> betray is better
If Ben BETRAYS : silent=10yr vs betray=8yr -> betray is better把自己放进阿达的座位,一路推下来。她管不了阿本,于是她把阿本的两种可能逐一考虑。*假设阿本沉默。*那么她沉默得一年,出卖却得零年——出卖胜出。*再假设阿本出卖。*那么她沉默得十年,出卖却得八年——出卖又一次胜出。在两种情形里,无论阿本可能怎么做,阿达都是出卖更好。一种无论对方怎么选都胜过其余所有选项的招数,有个名字:占优策略。
困境的力道,来自这种对称。从阿本那边看,博弈一模一样,所以出卖也是*他的*占优策略。于是两个谨慎、又只顾自身利益的思考者双双出卖——落进右下角那个格子,各判八年。可回头看看矩阵:他俩若都沉默,本只需各服一年。他们各自无懈可击的逻辑,却把两人一同送进了一个对双方都显然更糟的结局。这一记当头重击,就是囚徒困境,而那份惊讶始终不会真正消退。
陷阱为何牢不可破:一个稳定却糟糕的均衡
你也许会抗议:他俩既然都看出彼此都能只判一年,那不就……合作就好了?残酷的地方就在这里。想象他们事先不知怎么就约好了都沉默。此刻阿达坐在上了锁的房里盘算:“阿本答应沉默了。如果他守约,我出卖就能脱身——零年,而不是一年。”那个约定本身,反而*抬高*了她毁约的诱惑。而阿本在他的房间里,对她想的是一模一样的念头。这个合作的协议并不稳定:每个人都有一个私下毁约的理由。
相比之下,双双出卖的结局却稳如磐石。已经出卖、坐在那里的阿达问自己:“既然阿本出卖了,我当初保持沉默会更好吗?”不会——沉默会让她判十年,而不是八年。她不后悔,没有理由单方面改变自己的招数,阿本也一样。一个没有任何玩家能靠单独改变自己的选择而变好的结局,就是纳什均衡——你在上一篇里见过的那个核心解概念。这个博弈的悲剧在于:它唯一的纳什均衡,恰恰是两名玩家若能商量、最不愿一同选择的那个结局。
同一个陷阱,换上经济的外衣
把监狱剥掉,这个结构便在整个经济里到处重现。想象同一航线上的两家航空公司,正在决定票价定高还是定低。如果两家都把票价定得高,它们就能分享一份丰厚的利润。可每一家都被压价所诱惑:把价降一点,你就抢走对手的客人、赚得更多——*只要对手还把价定高*。于是两家都降价。票价崩塌,乘客欢呼,两家航空公司最终落进“双双出卖”的格子:低票价、薄利润,恰恰是谁都不想待的地方。这就是价格战,一场穿着西装的囚徒困境。
这正是为什么一个卡特尔如此容易瓦解。寡头市场里寥寥几家生产者——比方说一个石油卡特尔——约定把产量压低,好让价格保持在高位,就像所有囚徒约定都沉默一样。可这份协议给了每个成员一个私下作弊的诱因:偷偷*多*抽一点,按其他人撑起来的高价卖出去。每个成员都感到这同一股拉力,于是配额被悄悄突破,产量节节攀升,卡特尔本想守住的那个高价,渐渐塌向竞争性的水平。卡特尔不是被敌人出卖的;它是被自利那再寻常不过的算术给消解掉的。
同样的逻辑会掏空大海。想象许多渔船共用一片海洋——一种公共池塘资源。如果人人都适度捕捞,鱼群就能补充更新、世世代代养活所有人。可每个船长都这样盘算:“我留着不捞的鱼,反正也会被别人下网捞走,那我现在捞了算了。”每个船长都这么想,于是全都过度捕捞,共有的鱼群随之崩溃——让每个人都落得比克制时更糟。这就是从两名玩家放大到一整支船队的囚徒困境,这个多人版本,我们会在后面的篇章里再回来细看。
逃出陷阱的办法——以及它们诚实的限度
如果困境无可逃脱,合作便不可能——然而航空公司有时确实守住价格,卡特尔有时确实维系,渔场有时也确实被挽救。那么玩家是怎么爬出来的?最重要的那条逃生通道,是重复。上面那个一锤子买卖的版本之所以注定走向出卖,恰恰因为没有明天。可如果你和同一个伙伴把同一个博弈反复地玩,一股新的力量便出现了:今天的出卖,可能在此后的每一轮里招来报复。
在这些重复博弈里,一种惊人简单的策略往往奏效:“以牙还牙”——第一轮先合作,此后每一轮只照搬对手上一轮的做法。你跟我合作,我就回敬合作;你出卖我,我下一轮就出卖你。当玩家足够看重未来时,失去未来合作的那份逼近的威胁,可以盖过作弊一次性的好处,于是稳定的合作就变得可能。这正是“反复打交道才能建立信任”的正式内核,也解释了为什么长期的对手与邻里之间,往往能在陌生人做不到合作的地方合作起来。
最后一道护栏。0/1/8/10 这组整齐的数字是一个模型,不是一次测量;把收益改一改,困境可能就整个消解了。而真实的人,并非故事所假定的那种冷冰冰的计算器——在实验里,许多人合作的程度远超纯粹自利所预测的,受公平、内疚、愤怒,或仅仅是信任对方所左右。囚徒困境之所以如此宝贵,不是因为它描述了所有人永远如何行事,而是因为它以残酷的清晰,分离出了合作之所以脆弱的那个确切缘由:当私人诱因与公共利益指向相反的方向时,好的结果要想存活下来,光有好意是不够的。