決策變成「策略性」的那一刻
到目前為止,你在這個領域裡做的一切,悄悄地說,都是一項單人活動。一位消費者拿自己的滿足感去權衡自己的預算。一家完全競爭裡的企業,只是從牌子上讀出市場價、再選個數量。哪怕是一家獨佔市場的壟斷者,也只需查閱它自己的需求曲線。每一種情形裡,你都能靠死盯著*你自己*的數字找到最佳選擇。沒有人回望著你。
現在想像同一個街角上的兩家加油站。如果你降價,你的對手可能也跟著降——把你本想搶來的顧客一筆勾銷。如果你漲價,她可能按兵不動,把你整條街的客人都接走。突然之間,沒有哪個「最佳價格」是你能孤立地算出來的,因為「我該怎麼做?」的正確答案是「看她怎麼做」——而她的答案又反過來取決於你。這種循環往復、彼此對視的情形,正是經濟學家所說的賽局,對它的正式研究就是賽局理論。
三種材料:參與者、策略、收益
每一場賽局,無論宏大還是瑣碎,都由同樣的三種賽局要素搭成。第一,參與者:做決定的人——兩家加油站、兩個國家、兩個室友。第二,每位參與者的策略:他們可選行動的完整清單,從「標價 1.5 元」到「造飛彈」再到「今晚洗碗」。第三,收益:在選擇的*每一種可能組合*下,每位參與者所得到的分數,它刻畫了他們對每個結果有多在乎。
收益是其中微妙的那一個,值得多停留一會兒。收益並不只是錢。它是一個數字,代表一位參與者對某個結果所看重的一切——利潤,沒錯,但也包括聲望、生存、公平,或者一份清靜。這跟前幾個階梯裡的效用是同一個把戲:把一個人的所有慾求壓縮成單一分數,好讓我們能問他偏好哪個結果。而關鍵在於,你的收益通常同時取決於*雙方*的選擇。這正是為什麼,你不先設想對方的策略,就沒法選定自己的策略。
收益矩陣:一張網格容納整場賽局
當兩位參與者各有兩個策略時,我們可以把整場賽局擺在一張叫收益矩陣的小網格上。一位參與者的策略標在列上,另一位的標在行上,四個格子裡每一個都裝著一*對*收益——每位參與者各一個數——對應那種選擇組合。現在就該把讀它養成習慣,因為收益矩陣是這整個階梯的主力工具。我們就給兩家加油站搭一張,它們各自只在「高價」和「低價」之間二選一。
Station B
High price Low price
+------------+------------+
High price | 10 , 10 | 2 , 14 |
Station A +------------+------------+
Low price | 14 , 2 | 5 , 5 |
+------------+------------+
In each cell: (A's payoff , B's payoff) = daily profit, $000s
If both go High: 10 each. If both go Low: 5 each.
If A undercuts (Low) while B stays High: A gets 14, B gets 2.把左下角那格當作一道範例來讀:A 選低價、B 選高價,於是 A 贏下價格戰、賺到 14(千元日利潤),而 B 守著高價卻沒了顧客,只賺到 2。對角線才道出真正的故事。友好的結果——雙方都高價、各賺 10——對*雙方*都好過那個你死我活的結果——雙方都低價、各賺 5。可看看是什麼在誘惑每一位參與者:無論 B 怎麼做,A 選低價都賺得更多(B 高價時 14 勝 10;B 低價時 5 勝 2)。這張矩陣已悄悄裝下了一個兩難,接下來的幾篇會把它層層揭開。
讀懂矩陣,並初嘗那套邏輯
想清楚這樣一張網格有個簡單辦法,它正是策略推理的核心:設身處地站到每位參與者的位置上,問一句:「對手每一種可能的做法,我各自的最佳回應是什麼?」老老實實這麼做,規律便會跳出來。在加油站賽局裡,無論 B 怎麼選,A 的最佳回應都是低價。當某一個策略,在對方每一種可能的行動面前都勝過其他所有備選時,它就被稱為支配策略。
- 選定一位參與者,假裝成他,完全無視另一方的收益數字。
- 假設對手出第一種策略。在那一列(或那一行)裡掃一遍你自己的收益,標出你的最佳回應。
- 對對手的另一種策略再來一遍:同樣找出你那唯一的最佳回應。
- 如果同一個回應兩次都勝出,你就找到了一個支配策略。現在換邊,為另一位參與者把這一切重做一遍。
把這套程序在兩家加油站身上各跑一遍,你會發現它們*各自*都有「低價」這個支配策略。於是雙方都理性地降了價,落進右下角那格,各賺 5——儘管左上角那格本可讓它們各賺 10。一對策略,若彼此都是對方的最佳回應,以至於在別人既定的做法之下誰都不後悔自己的一步,就是一個納什均衡。這裡的均衡正是那個令人沮喪的 5 比 5。這套自我挫敗的邏輯就是著名的囚徒困境,把它認認真真講清楚,是下一篇的活兒。
為什麼經濟學有那麼多東西暗地裡是一場賽局
這可不是專為加油站準備的客廳小把戲。回想上一階梯裡那塊缺失的拼圖:寡頭壟斷,一個只有寥寥幾家大企業的市場。不同於孤零零的壟斷者,也不同於完全競爭裡的芸芸眾生,寡頭的利潤繫於對手的動作——這正是相互依賴,也正因如此,供需那套機器在寡頭身上悄悄失靈了。賽局理論恰恰是為應對它而打造的工具:你剛讀過的那個價格賽局,*就是*寡頭問題的微縮版。
一旦握住這副鏡片,你就會處處看見賽局。兩個國家糾結要不要造武器,面對的矩陣形狀跟我們的加油站一模一樣——雙方都寧願裁軍,可各自又怕成了唯一裁軍的那個,於是雙雙擴軍:一場軍備競賽。一個工會和一個雇主就工資討價還價,各自掂量要硬撐還是要讓步,這就是在進行一場賽局。企業決定要不要打廣告、漁民共用一片日漸枯竭的漁場、政府選擇關稅,也都是。凡是你的最佳行動會隨別人彎折之處,那三種材料就潛伏在那裡。
在我們繼續深入之前,有一句誠實的告誡。收益矩陣裡那些利落的數字是一個模型,而非一次測量——它們假定每位參與者都知道收益、能前後一致地給結果排序,並冷靜地推向最佳回應。真實的人會誤判別人看重什麼,會出於怨恨或信任而行動,也幾乎不會眼前擺著一張整齊的網格。和這個領域裡每一個經濟模型一樣,矩陣的價值,在於釐清一種處境的*邏輯*——為什麼裁軍讓人覺得如此危險——而不在於把某個具體決定精確預測到分毫。這樣去用,它便是你將遇到的最富啟發的觀念之一。