JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

賭徒破產與常返性

賭徒的財富每次上下一元地遊走,直到歸零或達標。我們會精確解出破產的機率與牌局的長短,再追問更深的問題:若任其無止境地走下去,這條隨機漫步總會回到它出發的原點嗎?

佈置賭徒的問題

前一篇交給你簡單隨機漫步:從某個整數出發,每一步以機率 p 走 +1、以機率 q = 1 - p 走 -1,每次都互相獨立。現在我們給它裝上牆。想像一位賭徒手握 i 元,每局下注一元,並在破產(到達 0)或達標(到達 N 元)的那一刻收手。這條漫步正是賭徒的財富;位於 0 與 N 的兩道牆是吸收的——漫步一旦碰到任一道便永遠停下。這就是賭徒破產問題,而頭號問題說起來很簡單:從 i 出發,在到達 N 之前先碰到 0(破產)的機率是多少?

在動任何代數之前,先磨利直覺。賭徒對抗的不是單一次擲幣,而是一整串擲幣,問題在於遊走的財富先碰到哪一道牆。兩股力量在角力:可能把你帶向任一邊的隨機抖動,以及漂移——若 p 不恰好是 1/2,這條漫步就帶有與生俱來的傾斜。朝向 N 的漂移幫你達標;朝向 0 的漂移(這正是每一場真實賭場遊戲給玩家的,因為對玩家而言 p < 1/2)把你推向破產。賭徒破產之美,在於我們能對任意起始財富 i、任意目標 N、任意 p 算出精確的破產機率——而答案很乾淨。

對第一步取條件來求解

令 h(i) 為從財富 i 出發、最終破產(在 N 之前碰到 0)的機率。訣竅是對最初的一注取條件,運用全機率定律。一局之後你不是在 i+1(機率 p)就是在 i-1(機率 q),而從那裡起,未來是一個從新財富出發、全新的賭徒破產問題——因為各步獨立且同分布,漫步並不記得自己是怎麼走到當前位置的。於是 h(i) = p · h(i+1) + q · h(i-1),邊界條件為 h(0) = 1(已破產)與 h(N) = 0(已獲勝)。這是一條工整的遞迴關係,它把每個內部點上的 h 都釘死。

解出這條遞迴會得到兩種情形。當牌局公正(p = q = 1/2),答案簡潔得令人屏息:h(i) = 1 - i/N,所以破產機率就是你還得往上爬到 N 所占的比例。從中點出發(i = N/2),你恰好有一半的時候會破產。當牌局有偏時,令 r = q/p 為輸贏勝算之比;則 h(i) = (r^N - r^i) / (r^N - 1)。別去背公式——去感受它。若 r > 1(玩家居於劣勢,p < 1/2),r 的次方會暴增,除非你起點極接近 N,否則破產幾乎成定局。

Recurrence:   h(i) = p*h(i+1) + q*h(i-1),   h(0)=1,  h(N)=0

Fair  (p = 1/2):     h(i) = 1 - i/N
Biased (r = q/p):    h(i) = (r^N - r^i) / (r^N - 1)

Example, fair, i=50, N=100:  ruin prob = 1 - 50/100 = 0.5
Example, p=18/38 roulette-red, i=100, N=200, r=20/18:  ruin ~ 0.99996
破產機率。每注一點點的劣勢(r 僅略大於 1)在許多注之後複合成幾乎必然的破產——只要你的目標夠遠。

牌局會持續多久?

知道自己會不會破產只是故事的一半;你還想知道牌局在停於某一道牆之前要跑多少注。令 d(i) 為從 i 出發直到被吸收的期望步數。同樣的取條件技巧可用,但此刻每一步耗去一單位時間,所以 d(i) = 1 + p · d(i+1) + q · d(i-1),邊界為 d(0) = d(N) = 0。在公正情形下,這解出驚人乾淨的 d(i) = i · (N - i)。這就是期望持續時間——對這兩道牆的平均碰撞時間——它在正中央達到最大,因為那裡離兩個出口都最遠。

代入數字,結果令人意外。公正牌局從 i = 50 出發、目標 N = 100,期望持續 50 · 50 = 2500 注。對一個到頭來你只贏一半的遊戲而言,這是漫長的一晚。這個教訓與賭徒謬誤彆扭地並陳:漫步確實沒有記憶,所以一長串連敗並不會讓下一注更安全——然而那段*整體*旅程卻受這些精確、可知的法則支配。逐步層次毫無記憶的隨機性,在整局層次仍生出剛硬、可預測的結構。

常返性:若沒有牆呢?

現在把目標那道牆整個拿掉,讓漫步在所有整數上永遠跑下去。自然的問題變成:從 0 出發,這條漫步將來會回到 0 嗎?若回歸是確定的(機率 1),稱該狀態為常返的;若有正機率使漫步飄走而永不回來,則稱暫態的。這是常返與暫態的核心,也正是賭徒破產派上用場之處,因為把一道牆推向無窮,我們就能從破產公式裡讀出答案。

取公正漫步並讓 N 趨於無窮。破產機率 h(i) = 1 - i/N 對每個固定起點 i 都趨於 1。換言之:沒有上牆時,公正漫步必定終會碰到 0——同理也必定終會碰到任何高度。所以整數上的對稱簡單隨機漫步是常返的:它以機率 1 回到起點,事實上還會無窮多次造訪每個整數。但這裡有個會絆倒人的誠實陷阱:雖然回歸是確定的,回歸的*期望時間*卻是無窮。常返性保證你會回家,卻不保證等待的時間合理。這稱為零常返,而 d(i) = i·(N-i) 的持續時間隨 N 增大而炸開,正是它的指紋。

偏差改變一切。若 p 不是 1/2,漫步帶有穩定漂移,強大數法則說 n 步後的位置表現得像 n·(p - q),朝正無窮或負無窮行進。漂移的漫步是暫態的:早期它或許會回訪起點幾次,但以機率 1 它終將一去不返。這在破產公式裡也看得見——對有偏漫步,回歸機率在 N 增大時的極限嚴格小於 1。所以刀刃般的 p = 1/2 是特殊的:恰在公正處漫步常返,而任何漂移,無論多輕微,都會把它推入暫態。

為何維度要緊:一個著名的轉折

有個值得認識的著名延伸,因為它顯示常返性是脆弱的。把對稱簡單隨機漫步不放在直線上,而放在格點上,每次走向隨機的鄰居。在一維直線與二維格點上,漫步仍是常返的——回到起點是確定的。但在三維裡它變成暫態:在無限城市格點上遊蕩的醉漢總能找到回家的路,而在三維空間中飛行、每次隨機走一單位步的鳥,回歸的機率只有約 0.34——大約三分之一的機會。波利亞如此總結:「醉漢終會找到回家的路,但醉鳥可能永遠迷失。」