賭徒永恆的夢想
你來到本篇時,已經知道[[martingale|鞅]]是什麼:一個依附於過濾 F_0, F_1, F_2, ... 的序列 M_0, M_1, M_2, ...,其條件期望從不漂移,E[M_(n+1) given F_n] = M_n。用賭博的話來說,M_n 是你在一場完全公平的賭局玩了 n 回合之後的財富,而那條定義式說的是:在給定你至今所見的一切之下,你下一回合的期望財富,恰好等於你現在手上所握有的。沒有優勢、沒有漂移、沒有免費的午餐——就平均而言。
但賭徒並不滿足。「好吧,」他說,「在公平賭局上平注下注,讓我一無所獲。但我很聰明。我會看著賭局展開,每一回合都調整我押多少——感覺手氣好時押大、謹慎時押小、輸了一場之後乾脆不玩。難道沒有某種這樣的系統能把勝算扳向我這邊嗎?」這是機率史上最古老的夢想之一,而精確地回答它,正是本篇的全部用意。這個答案,化成定理之後,是斬釘截鐵的「不行」。
要回答它,我們不能憑空揮手。我們得用數學寫下,一套「押注系統」究竟被允許是什麼。關鍵的誠實檢驗在於:你第 n+1 回合的賭注,可以用上你截至(並包含)第 n 回合所觀察到的一切——但在你下定決心之前,不准偷看第 n+1 回合的結果。這一條公平性的約束,認真對待之後,正是讓整套理論行得通的關鍵,而它有一個精確的名字,我們接下來就會遇到。
可預測:在你看見之前就決定
把你在第 n 回合的賭注記為數字 C_n:你在第 n 場賭局上押多少單位。一套押注系統就是一整個序列 C_1, C_2, C_3, ...。公平性規則說,C_n 只能用 F_(n-1) 來決定——也就是第 n-1 回合結束時、第 n 回合開打之前所擁有的資訊。具有這個性質的過程,也就是 C_n 由 F_(n-1)(而非 F_n)所決定,稱為[[predictable-process|可預測過程]](有些作者稱之為「可預見的」)。它是「你先放下籌碼,輪盤才轉動」的數學版本。
這條規則內部還是有充裕的空間。C_n 可以用任意複雜的方式依賴整段過去:累計總額、最近七次結果、連輸幾場、乃至昨天記下的月相。它甚至可以是零——意思是那一回合你不玩——或是負的,意思是你押反向的一邊。可預測性並不會讓你變笨或變得膽小;它只禁止時間旅行。任何人類真能實際執行的押注策略都是可預測的,而這正是接下來那條定理如此具有摧毀性的原因。
鞅變換:離散的隨機積分
現在我們把賭局和策略結合起來。設 M_0, M_1, M_2, ... 是那個鞅(公平賭局),把它每回合的變化寫成增量 DM_n = M_n - M_(n-1)——也就是第 n 回合底層賭局的擺動,這是你控制不了的。如果你在第 n 回合押 C_n 單位,那一回合的獲利就是 C_n 乘以 DM_n:你的賭注大小,乘上賭局移動了多少。從某個初始財富出發(單看純贏利時常取為 0),你玩了 n 回合之後的總財富,就是這些獲利的累進和。
Increments of the game: DM_n = M_n - M_(n-1)
Your winnings after n rounds (this is the transform (C . M)_n):
(C . M)_n = C_1 * DM_1 + C_2 * DM_2 + ... + C_n * DM_n
= sum over k=1..n of C_k * (M_k - M_(k-1))
C_k is your stake on round k -- chosen from F_(k-1) (predictable)
DM_k is how the fair game moved on round k (mean zero given F_(k-1))這個累進和,寫作 (C . M)_n,就是 M 被 C 所做的[[martingale-transform|鞅變換]]。這個點記號是刻意借來的:它恰恰是隨機積分的離散表親——也就是你日後會以伊藤積分之名遇見的那個東西,其中 C_n 變成一個可預測的交易部位,而 DM_n 變成布朗運動的增量。現在就學會把 (C . M)_n 讀作「策略對賭局做積分」,等到連續時間版本登場時,會有極大的回報。而就今天而言,它更簡單、更生動:它就是你一回合一回合的本金。
定理:變換之後仍是鞅
這裡就是核心,那個粉碎賭徒夢想的結論。若 M 是鞅、C 是可預測的(且有界,或在別的意義下夠可積),則變換 (C . M) 仍是鞅,並且從零起步。這正是沒有押注系統能贏過公平賭局的精確陳述。無論你夢想出什麼可預測的方案——輸了就加倍、謹慎的平注、靠直覺孤注一擲——所得到的財富仍然是一場公平賭局。它在每一個未來時刻的期望值,都等於它現在的值,也就是零。就平均而言,你既不賺也不賠,沒了。
證明很短、且值得一看,因為它讓可預測性的角色變得透明。我們對 (C . M) 驗證鞅條件。變換的一步變化就是 C_(n+1) 乘以 DM_(n+1)。所以 E[(C . M)_(n+1) - (C . M)_n given F_n] = E[C_(n+1)(M_(n+1) - M_n) given F_n]。現在是關鍵的一步:C_(n+1) 是可預測的,所以在給定 F_n 之下它是已知的——就這個條件期望而言它形同一個常數,依取出已知者法則它可以滑到外面。剩下 C_(n+1) 乘以 E[M_(n+1) - M_n given F_n],而因為 M 是鞅,裡頭那個期望是零。整個增量的條件均值是零,所以 (C . M) 是鞅。
- 把下一回合的獲利寫成單獨一項:(C . M)_(n+1) - (C . M)_n = C_(n+1) * (M_(n+1) - M_n)。
- 對那筆獲利取 E[ . given F_n]。因為 C_(n+1) 是可預測的,它是 F_n-已知的,可以從條件期望中提出來。
- 你剩下 C_(n+1) * E[M_(n+1) - M_n given F_n]。鞅性質使裡頭那個期望等於 0。
- 因此 E[(C . M)_(n+1) given F_n] = (C . M)_n:變換滿足鞅方程,再取一次普通期望就得到對每個 n 都有 E[(C . M)_n] = 0。
請精確注意可預測性是在哪裡發揮了作用:在第 2 步。倘若 C_(n+1) 只是可料的——被允許依賴第 n+1 回合的結果——它就不能從條件期望中提出來,整個論證便會崩潰。一個在決定賭注大小之前就看見結果的策略,不是策略,而是先見之明,先見之明當然會「贏過」賭局。這條定理對自己的假設很誠實:拿掉「不准偷看」這條規則,結論就不成立了。
為什麼鞅不會被擊潰:加倍法與其他幻覺
最有名的「系統」是加倍策略,在賭場裡也被混淆地暱稱為 martingale:押 1;若輸了,押 2;再輸,押 4,然後 8、16、...,直到你第一次贏,那一把就把先前所有的損失連本帶一個單位全部討回。它感覺像是穩賺不賠。而且嚴格說來,這套策略每一個完成的回合確實淨賺 +1。那為什麼它不會印鈔票?因為鞅變換在每一個有限時刻都是公平的:在任何固定的 n,E[(C . M)_n] = 0。那個幾乎必然的小贏 +1,恰好被一個罕見而巨大的損失抵銷——當一連串長長的連敗逼出一個你掏不出的賭注時。
這個幻覺完全活在「每一個有限時刻」與「在極限中」之間的縫隙裡。加倍法的玩家暗中假設了無限的資本與無限的時間。在一個真實、有限的本金之下,賭注終究會超過你所有的,那個讓你破產的連敗有著微小但為正的機率,於是期望結果又落回零。這也是一張貼在更深結論上的警告標籤:你下一篇會遇到的最佳停止定理說,即使在一個聰明選定的隨機停時,鞅依然公平——但這只在某些條件下成立(有界性,或一個有界的停時),而加倍策略正是刻意違反了這些條件。下一篇會把那些條件講清楚。
遠不止於賭博
若是離開鞅變換時,以為它只關乎賭場,那就太可惜了。完全相同的物件,正是數理金融的骨幹:把「賭注 C_n」換成「持有的股數」,把「增量 DM_n」換成「折現資產價格的變動」,則 (C . M)_n 就成了一個自融資交易策略的價值。「鞅的可預測變換仍是鞅」這條定理,換上那身衣服之後,說的正是:你無法從一個被公平定價的市場中賺得無風險利潤——這是無套利定價的根基。你現在理解的離散版本,到了連續時間就成為伊藤積分。
這個變換也能反向運轉,作為一種建造有用的鞅的方法,而不只是檢驗策略。你會倚重的一個核心構造是[[doob-martingale|杜布鞅]]:固定一個最終的隨機量,然後一次揭露一片關於它的資訊,令 M_n 等於「在至今所知之下、最終值的條件期望」。依塔性質,這自動就是一個鞅,再配上變換,便驅動了像 Azuma–Hoeffding 不等式這樣的集中結果。變換不只是一條「此路不通」的定理;它是一件工作坊裡的工具。
帶三件事走進下一篇。第一,一套押注/交易系統是一個可預測過程——在結果出現之前就拍板,但可以自由地依賴所有過去。第二,公平賭局被這樣一套系統所做的鞅變換 (C . M) 仍是公平的:在每一個有限的 n 都有 E[(C . M)_n] = 0,這正是「你贏不了公平賭局」的嚴謹形式。第三,加倍法的悖論,不是靠打破那份公平性來化解,而是靠「每一個有限時刻」與「極限」之間的縫隙來化解——而接下來登場的最佳停止定理,正是帶著明確的條件穿行於這道縫隙之中。