賭徒破產與常返性

佈置賭徒的問題

前一篇交給你簡單隨機漫步：從某個整數出發，每一步以機率 p 走 +1、以機率 q = 1 - p 走 -1，每次都互相獨立。現在我們給它裝上牆。想像一位賭徒手握 i 元，每局下注一元，並在破產（到達 0）或達標（到達 N 元）的那一刻收手。這條漫步正是賭徒的財富；位於 0 與 N 的兩道牆是吸收的——漫步一旦碰到任一道便永遠停下。這就是賭徒破產問題，而頭號問題說起來很簡單：從 i 出發，在到達 N 之前先碰到 0（破產）的機率是多少？

在動任何代數之前，先磨利直覺。賭徒對抗的不是單一次擲幣，而是一整串擲幣，問題在於遊走的財富先碰到哪一道牆。兩股力量在角力：可能把你帶向任一邊的隨機抖動，以及漂移——若 p 不恰好是 1/2，這條漫步就帶有與生俱來的傾斜。朝向 N 的漂移幫你達標；朝向 0 的漂移（這正是每一場真實賭場遊戲給玩家的，因為對玩家而言 p < 1/2）把你推向破產。賭徒破產之美，在於我們能對任意起始財富 i、任意目標 N、任意 p 算出精確的破產機率——而答案很乾淨。

對第一步取條件來求解

令 h(i) 為從財富 i 出發、最終破產（在 N 之前碰到 0）的機率。訣竅是對最初的一注取條件，運用全機率定律。一局之後你不是在 i+1（機率 p）就是在 i-1（機率 q），而從那裡起，未來是一個從新財富出發、全新的賭徒破產問題——因為各步獨立且同分布，漫步並不記得自己是怎麼走到當前位置的。於是 h(i) = p · h(i+1) + q · h(i-1)，邊界條件為 h(0) = 1（已破產）與 h(N) = 0（已獲勝）。這是一條工整的遞迴關係，它把每個內部點上的 h 都釘死。

解出這條遞迴會得到兩種情形。當牌局公正（p = q = 1/2），答案簡潔得令人屏息：h(i) = 1 - i/N，所以破產機率就是你還得往上爬到 N 所占的比例。從中點出發（i = N/2），你恰好有一半的時候會破產。當牌局有偏時，令 r = q/p 為輸贏勝算之比；則 h(i) = (r^N - r^i) / (r^N - 1)。別去背公式——去感受它。若 r > 1（玩家居於劣勢，p < 1/2），r 的次方會暴增，除非你起點極接近 N，否則破產幾乎成定局。

Recurrence:   h(i) = p*h(i+1) + q*h(i-1),   h(0)=1,  h(N)=0

Fair  (p = 1/2):     h(i) = 1 - i/N
Biased (r = q/p):    h(i) = (r^N - r^i) / (r^N - 1)

Example, fair, i=50, N=100:  ruin prob = 1 - 50/100 = 0.5
Example, p=18/38 roulette-red, i=100, N=200, r=20/18:  ruin ~ 0.99996

破產機率。每注一點點的劣勢（r 僅略大於 1）在許多注之後複合成幾乎必然的破產——只要你的目標夠遠。

牌局會持續多久？

知道自己會不會破產只是故事的一半；你還想知道牌局在停於某一道牆之前要跑多少注。令 d(i) 為從 i 出發直到被吸收的期望步數。同樣的取條件技巧可用，但此刻每一步耗去一單位時間，所以 d(i) = 1 + p · d(i+1) + q · d(i-1)，邊界為 d(0) = d(N) = 0。在公正情形下，這解出驚人乾淨的 d(i) = i · (N - i)。這就是期望持續時間——對這兩道牆的平均碰撞時間——它在正中央達到最大，因為那裡離兩個出口都最遠。

代入數字，結果令人意外。公正牌局從 i = 50 出發、目標 N = 100，期望持續 50 · 50 = 2500 注。對一個到頭來你只贏一半的遊戲而言，這是漫長的一晚。這個教訓與賭徒謬誤彆扭地並陳：漫步確實沒有記憶，所以一長串連敗並不會讓下一注更安全——然而那段*整體*旅程卻受這些精確、可知的法則支配。逐步層次毫無記憶的隨機性，在整局層次仍生出剛硬、可預測的結構。

常返性：若沒有牆呢？

現在把目標那道牆整個拿掉，讓漫步在所有整數上永遠跑下去。自然的問題變成：從 0 出發，這條漫步將來會回到 0 嗎？若回歸是確定的（機率 1），稱該狀態為常返的；若有正機率使漫步飄走而永不回來，則稱暫態的。這是常返與暫態的核心，也正是賭徒破產派上用場之處，因為把一道牆推向無窮，我們就能從破產公式裡讀出答案。

取公正漫步並讓 N 趨於無窮。破產機率 h(i) = 1 - i/N 對每個固定起點 i 都趨於 1。換言之：沒有上牆時，公正漫步必定終會碰到 0——同理也必定終會碰到任何高度。所以整數上的對稱簡單隨機漫步是常返的：它以機率 1 回到起點，事實上還會無窮多次造訪每個整數。但這裡有個會絆倒人的誠實陷阱：雖然回歸是確定的，回歸的*期望時間*卻是無窮。常返性保證你會回家，卻不保證等待的時間合理。這稱為零常返，而 d(i) = i·(N-i) 的持續時間隨 N 增大而炸開，正是它的指紋。

偏差改變一切。若 p 不是 1/2，漫步帶有穩定漂移，強大數法則說 n 步後的位置表現得像 n·(p - q)，朝正無窮或負無窮行進。漂移的漫步是暫態的：早期它或許會回訪起點幾次，但以機率 1 它終將一去不返。這在破產公式裡也看得見——對有偏漫步，回歸機率在 N 增大時的極限嚴格小於 1。所以刀刃般的 p = 1/2 是特殊的：恰在公正處漫步常返，而任何漂移，無論多輕微，都會把它推入暫態。

為何維度要緊：一個著名的轉折

有個值得認識的著名延伸，因為它顯示常返性是脆弱的。把對稱簡單隨機漫步不放在直線上，而放在格點上，每次走向隨機的鄰居。在一維直線與二維格點上，漫步仍是常返的——回到起點是確定的。但在三維裡它變成暫態：在無限城市格點上遊蕩的醉漢總能找到回家的路，而在三維空間中飛行、每次隨機走一單位步的鳥，回歸的機率只有約 0.34——大約三分之一的機會。波利亞如此總結：「醉漢終會找到回家的路，但醉鳥可能永遠迷失。」