什麼是賽局？參與者、策略與收益

決策變成「策略性」的那一刻

到目前為止，你在這個領域裡做的一切，悄悄地說，都是一項單人活動。一位消費者拿自己的滿足感去權衡自己的預算。一家完全競爭裡的企業，只是從牌子上讀出市場價、再選個數量。哪怕是一家獨佔市場的壟斷者，也只需查閱它自己的需求曲線。每一種情形裡，你都能靠死盯著*你自己*的數字找到最佳選擇。沒有人回望著你。

現在想像同一個街角上的兩家加油站。如果你降價，你的對手可能也跟著降——把你本想搶來的顧客一筆勾銷。如果你漲價，她可能按兵不動，把你整條街的客人都接走。突然之間，沒有哪個「最佳價格」是你能孤立地算出來的，因為「我該怎麼做？」的正確答案是「看她怎麼做」——而她的答案又反過來取決於你。這種循環往復、彼此對視的情形，正是經濟學家所說的賽局，對它的正式研究就是賽局理論。

三種材料：參與者、策略、收益

每一場賽局，無論宏大還是瑣碎，都由同樣的三種賽局要素搭成。第一，參與者：做決定的人——兩家加油站、兩個國家、兩個室友。第二，每位參與者的策略：他們可選行動的完整清單，從「標價 1.5 元」到「造飛彈」再到「今晚洗碗」。第三，收益：在選擇的*每一種可能組合*下，每位參與者所得到的分數，它刻畫了他們對每個結果有多在乎。

收益是其中微妙的那一個，值得多停留一會兒。收益並不只是錢。它是一個數字，代表一位參與者對某個結果所看重的一切——利潤，沒錯，但也包括聲望、生存、公平，或者一份清靜。這跟前幾個階梯裡的效用是同一個把戲：把一個人的所有慾求壓縮成單一分數，好讓我們能問他偏好哪個結果。而關鍵在於，你的收益通常同時取決於*雙方*的選擇。這正是為什麼，你不先設想對方的策略，就沒法選定自己的策略。

收益矩陣：一張網格容納整場賽局

當兩位參與者各有兩個策略時，我們可以把整場賽局擺在一張叫收益矩陣的小網格上。一位參與者的策略標在列上，另一位的標在行上，四個格子裡每一個都裝著一*對*收益——每位參與者各一個數——對應那種選擇組合。現在就該把讀它養成習慣，因為收益矩陣是這整個階梯的主力工具。我們就給兩家加油站搭一張，它們各自只在「高價」和「低價」之間二選一。

                       Station B
                  High price   Low price
               +------------+------------+
  High price   |  10 , 10   |   2 , 14   |
Station A      +------------+------------+
  Low  price   |  14 ,  2   |   5 ,  5   |
               +------------+------------+

  In each cell:  (A's payoff , B's payoff)  =  daily profit, $000s
  If both go High: 10 each. If both go Low: 5 each.
  If A undercuts (Low) while B stays High: A gets 14, B gets 2.

加油站價格賽局的 2×2 收益矩陣。每格中左邊的數是 A 的利潤，右邊的是 B 的。兩家一起維持高價本可各賺 10——可每一家都禁不住想偷偷降價去搶那個 14。

把左下角那格當作一道範例來讀：A 選低價、B 選高價，於是 A 贏下價格戰、賺到 14（千元日利潤），而 B 守著高價卻沒了顧客，只賺到 2。對角線才道出真正的故事。友好的結果——雙方都高價、各賺 10——對*雙方*都好過那個你死我活的結果——雙方都低價、各賺 5。可看看是什麼在誘惑每一位參與者：無論 B 怎麼做，A 選低價都賺得更多（B 高價時 14 勝 10；B 低價時 5 勝 2）。這張矩陣已悄悄裝下了一個兩難，接下來的幾篇會把它層層揭開。

讀懂矩陣，並初嘗那套邏輯

想清楚這樣一張網格有個簡單辦法，它正是策略推理的核心：設身處地站到每位參與者的位置上，問一句：「對手每一種可能的做法，我各自的最佳回應是什麼？」老老實實這麼做，規律便會跳出來。在加油站賽局裡，無論 B 怎麼選，A 的最佳回應都是低價。當某一個策略，在對方每一種可能的行動面前都勝過其他所有備選時，它就被稱為支配策略。

選定一位參與者，假裝成他，完全無視另一方的收益數字。
假設對手出第一種策略。在那一列（或那一行）裡掃一遍你自己的收益，標出你的最佳回應。
對對手的另一種策略再來一遍：同樣找出你那唯一的最佳回應。
如果同一個回應兩次都勝出，你就找到了一個支配策略。現在換邊，為另一位參與者把這一切重做一遍。

把這套程序在兩家加油站身上各跑一遍，你會發現它們*各自*都有「低價」這個支配策略。於是雙方都理性地降了價，落進右下角那格，各賺 5——儘管左上角那格本可讓它們各賺 10。一對策略，若彼此都是對方的最佳回應，以至於在別人既定的做法之下誰都不後悔自己的一步，就是一個納什均衡。這裡的均衡正是那個令人沮喪的 5 比 5。這套自我挫敗的邏輯就是著名的囚徒困境，把它認認真真講清楚，是下一篇的活兒。

為什麼經濟學有那麼多東西暗地裡是一場賽局

這可不是專為加油站準備的客廳小把戲。回想上一階梯裡那塊缺失的拼圖：寡頭壟斷，一個只有寥寥幾家大企業的市場。不同於孤零零的壟斷者，也不同於完全競爭裡的芸芸眾生，寡頭的利潤繫於對手的動作——這正是相互依賴，也正因如此，供需那套機器在寡頭身上悄悄失靈了。賽局理論恰恰是為應對它而打造的工具：你剛讀過的那個價格賽局，*就是*寡頭問題的微縮版。

一旦握住這副鏡片，你就會處處看見賽局。兩個國家糾結要不要造武器，面對的矩陣形狀跟我們的加油站一模一樣——雙方都寧願裁軍，可各自又怕成了唯一裁軍的那個，於是雙雙擴軍：一場軍備競賽。一個工會和一個雇主就工資討價還價，各自掂量要硬撐還是要讓步，這就是在進行一場賽局。企業決定要不要打廣告、漁民共用一片日漸枯竭的漁場、政府選擇關稅，也都是。凡是你的最佳行動會隨別人彎折之處，那三種材料就潛伏在那裡。

在我們繼續深入之前，有一句誠實的告誡。收益矩陣裡那些利落的數字是一個模型，而非一次測量——它們假定每位參與者都知道收益、能前後一致地給結果排序，並冷靜地推向最佳回應。真實的人會誤判別人看重什麼，會出於怨恨或信任而行動，也幾乎不會眼前擺著一張整齊的網格。和這個領域裡每一個經濟模型一樣，矩陣的價值，在於釐清一種處境的*邏輯*——為什麼裁軍讓人覺得如此危險——而不在於把某個具體決定精確預測到分毫。這樣去用，它便是你將遇到的最富啟發的觀念之一。