JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

什麼是賽局?參與者、策略與收益

在上一階梯裡,一家企業的最佳行動只取決於它自己的成本。現在我們跨過一道門檻:你的最佳行動取決於別人怎麼決定——而對方也正盤算著你。僅僅這一個轉折,就是賽局理論的全部。

決策變成「策略性」的那一刻

到目前為止,你在這個領域裡做的一切,悄悄地說,都是一項單人活動。一位消費者拿自己的滿足感去權衡自己的預算。一家完全競爭裡的企業,只是從牌子上讀出市場價、再選個數量。哪怕是一家獨佔市場的壟斷者,也只需查閱它自己的需求曲線。每一種情形裡,你都能靠死盯著*你自己*的數字找到最佳選擇。沒有人回望著你。

現在想像同一個街角上的兩家加油站。如果你降價,你的對手可能也跟著降——把你本想搶來的顧客一筆勾銷。如果你漲價,她可能按兵不動,把你整條街的客人都接走。突然之間,沒有哪個「最佳價格」是你能孤立地算出來的,因為「我該怎麼做?」的正確答案是「看她怎麼做」——而她的答案又反過來取決於你。這種循環往復、彼此對視的情形,正是經濟學家所說的賽局,對它的正式研究就是賽局理論

三種材料:參與者、策略、收益

每一場賽局,無論宏大還是瑣碎,都由同樣的三種賽局要素搭成。第一,參與者:做決定的人——兩家加油站、兩個國家、兩個室友。第二,每位參與者的策略:他們可選行動的完整清單,從「標價 1.5 元」到「造飛彈」再到「今晚洗碗」。第三,收益:在選擇的*每一種可能組合*下,每位參與者所得到的分數,它刻畫了他們對每個結果有多在乎。

收益是其中微妙的那一個,值得多停留一會兒。收益並不只是錢。它是一個數字,代表一位參與者對某個結果所看重的一切——利潤,沒錯,但也包括聲望、生存、公平,或者一份清靜。這跟前幾個階梯裡的效用是同一個把戲:把一個人的所有慾求壓縮成單一分數,好讓我們能問他偏好哪個結果。而關鍵在於,你的收益通常同時取決於*雙方*的選擇。這正是為什麼,你不先設想對方的策略,就沒法選定自己的策略。

收益矩陣:一張網格容納整場賽局

當兩位參與者各有兩個策略時,我們可以把整場賽局擺在一張叫收益矩陣的小網格上。一位參與者的策略標在列上,另一位的標在行上,四個格子裡每一個都裝著一*對*收益——每位參與者各一個數——對應那種選擇組合。現在就該把讀它養成習慣,因為收益矩陣是這整個階梯的主力工具。我們就給兩家加油站搭一張,它們各自只在「高價」和「低價」之間二選一。

                       Station B
                  High price   Low price
               +------------+------------+
  High price   |  10 , 10   |   2 , 14   |
Station A      +------------+------------+
  Low  price   |  14 ,  2   |   5 ,  5   |
               +------------+------------+

  In each cell:  (A's payoff , B's payoff)  =  daily profit, $000s
  If both go High: 10 each. If both go Low: 5 each.
  If A undercuts (Low) while B stays High: A gets 14, B gets 2.
加油站價格賽局的 2×2 收益矩陣。每格中左邊的數是 A 的利潤,右邊的是 B 的。兩家一起維持高價本可各賺 10——可每一家都禁不住想偷偷降價去搶那個 14。

把左下角那格當作一道範例來讀:A 選低價、B 選高價,於是 A 贏下價格戰、賺到 14(千元日利潤),而 B 守著高價卻沒了顧客,只賺到 2。對角線才道出真正的故事。友好的結果——雙方都高價、各賺 10——對*雙方*都好過那個你死我活的結果——雙方都低價、各賺 5。可看看是什麼在誘惑每一位參與者:無論 B 怎麼做,A 選低價都賺得更多(B 高價時 14 勝 10;B 低價時 5 勝 2)。這張矩陣已悄悄裝下了一個兩難,接下來的幾篇會把它層層揭開。

讀懂矩陣,並初嘗那套邏輯

想清楚這樣一張網格有個簡單辦法,它正是策略推理的核心:設身處地站到每位參與者的位置上,問一句:「對手每一種可能的做法,我各自的最佳回應是什麼?」老老實實這麼做,規律便會跳出來。在加油站賽局裡,無論 B 怎麼選,A 的最佳回應都是低價。當某一個策略,在對方每一種可能的行動面前都勝過其他所有備選時,它就被稱為支配策略

  1. 選定一位參與者,假裝成他,完全無視另一方的收益數字。
  2. 假設對手出第一種策略。在那一列(或那一行)裡掃一遍你自己的收益,標出你的最佳回應。
  3. 對對手的另一種策略再來一遍:同樣找出你那唯一的最佳回應。
  4. 如果同一個回應兩次都勝出,你就找到了一個支配策略。現在換邊,為另一位參與者把這一切重做一遍。

把這套程序在兩家加油站身上各跑一遍,你會發現它們*各自*都有「低價」這個支配策略。於是雙方都理性地降了價,落進右下角那格,各賺 5——儘管左上角那格本可讓它們各賺 10。一對策略,若彼此都是對方的最佳回應,以至於在別人既定的做法之下誰都不後悔自己的一步,就是一個納什均衡。這裡的均衡正是那個令人沮喪的 5 比 5。這套自我挫敗的邏輯就是著名的囚徒困境,把它認認真真講清楚,是下一篇的活兒。

為什麼經濟學有那麼多東西暗地裡是一場賽局

這可不是專為加油站準備的客廳小把戲。回想上一階梯裡那塊缺失的拼圖:寡頭壟斷,一個只有寥寥幾家大企業的市場。不同於孤零零的壟斷者,也不同於完全競爭裡的芸芸眾生,寡頭的利潤繫於對手的動作——這正是相互依賴,也正因如此,供需那套機器在寡頭身上悄悄失靈了。賽局理論恰恰是為應對它而打造的工具:你剛讀過的那個價格賽局,*就是*寡頭問題的微縮版。

一旦握住這副鏡片,你就會處處看見賽局。兩個國家糾結要不要造武器,面對的矩陣形狀跟我們的加油站一模一樣——雙方都寧願裁軍,可各自又怕成了唯一裁軍的那個,於是雙雙擴軍:一場軍備競賽。一個工會和一個雇主就工資討價還價,各自掂量要硬撐還是要讓步,這就是在進行一場賽局。企業決定要不要打廣告、漁民共用一片日漸枯竭的漁場、政府選擇關稅,也都是。凡是你的最佳行動會隨別人彎折之處,那三種材料就潛伏在那裡。

在我們繼續深入之前,有一句誠實的告誡。收益矩陣裡那些利落的數字是一個模型,而非一次測量——它們假定每位參與者都知道收益、能前後一致地給結果排序,並冷靜地推向最佳回應。真實的人會誤判別人看重什麼,會出於怨恨或信任而行動,也幾乎不會眼前擺著一張整齊的網格。和這個領域裡每一個經濟模型一樣,矩陣的價值,在於釐清一種處境的*邏輯*——為什麼裁軍讓人覺得如此危險——而不在於把某個具體決定精確預測到分毫。這樣去用,它便是你將遇到的最富啟發的觀念之一。