你贏不了一場公平的賭局：鞅變換

賭徒永恆的夢想

你來到本篇時，已經知道[[martingale|鞅]]是什麼：一個依附於過濾 F_0, F_1, F_2, ... 的序列 M_0, M_1, M_2, ...，其條件期望從不漂移，E[M_(n+1) given F_n] = M_n。用賭博的話來說，M_n 是你在一場完全公平的賭局玩了 n 回合之後的財富，而那條定義式說的是：在給定你至今所見的一切之下，你下一回合的期望財富，恰好等於你現在手上所握有的。沒有優勢、沒有漂移、沒有免費的午餐——就平均而言。

但賭徒並不滿足。「好吧，」他說，「在公平賭局上平注下注，讓我一無所獲。但我很聰明。我會看著賭局展開，每一回合都調整我押多少——感覺手氣好時押大、謹慎時押小、輸了一場之後乾脆不玩。難道沒有某種這樣的系統能把勝算扳向我這邊嗎？」這是機率史上最古老的夢想之一，而精確地回答它，正是本篇的全部用意。這個答案，化成定理之後，是斬釘截鐵的「不行」。

要回答它，我們不能憑空揮手。我們得用數學寫下，一套「押注系統」究竟被允許是什麼。關鍵的誠實檢驗在於：你第 n+1 回合的賭注，可以用上你截至（並包含）第 n 回合所觀察到的一切——但在你下定決心之前，不准偷看第 n+1 回合的結果。這一條公平性的約束，認真對待之後，正是讓整套理論行得通的關鍵，而它有一個精確的名字，我們接下來就會遇到。

可預測：在你看見之前就決定

把你在第 n 回合的賭注記為數字 C_n：你在第 n 場賭局上押多少單位。一套押注系統就是一整個序列 C_1, C_2, C_3, ...。公平性規則說，C_n 只能用 F_(n-1) 來決定——也就是第 n-1 回合結束時、第 n 回合開打之前所擁有的資訊。具有這個性質的過程，也就是 C_n 由 F_(n-1)（而非 F_n）所決定，稱為[[predictable-process|可預測過程]]（有些作者稱之為「可預見的」）。它是「你先放下籌碼，輪盤才轉動」的數學版本。

這條規則內部還是有充裕的空間。C_n 可以用任意複雜的方式依賴整段過去：累計總額、最近七次結果、連輸幾場、乃至昨天記下的月相。它甚至可以是零——意思是那一回合你不玩——或是負的，意思是你押反向的一邊。可預測性並不會讓你變笨或變得膽小；它只禁止時間旅行。任何人類真能實際執行的押注策略都是可預測的，而這正是接下來那條定理如此具有摧毀性的原因。

鞅變換：離散的隨機積分

現在我們把賭局和策略結合起來。設 M_0, M_1, M_2, ... 是那個鞅（公平賭局），把它每回合的變化寫成增量 DM_n = M_n - M_(n-1)——也就是第 n 回合底層賭局的擺動，這是你控制不了的。如果你在第 n 回合押 C_n 單位，那一回合的獲利就是 C_n 乘以 DM_n：你的賭注大小，乘上賭局移動了多少。從某個初始財富出發（單看純贏利時常取為 0），你玩了 n 回合之後的總財富，就是這些獲利的累進和。

Increments of the game:  DM_n = M_n - M_(n-1)

Your winnings after n rounds  (this is the transform (C . M)_n):

  (C . M)_n = C_1 * DM_1 + C_2 * DM_2 + ... + C_n * DM_n
            = sum over k=1..n of  C_k * (M_k - M_(k-1))

  C_k  is your stake on round k  -- chosen from F_(k-1)  (predictable)
  DM_k is how the fair game moved on round k             (mean zero given F_(k-1))

鞅變換 (C . M)：你那可預測的賭注 C_k，對公平賭局 M 的增量做積分。它是隨機積分在離散時間中的祖先。

這個累進和，寫作 (C . M)_n，就是 M 被 C 所做的[[martingale-transform|鞅變換]]。這個點記號是刻意借來的：它恰恰是隨機積分的離散表親——也就是你日後會以伊藤積分之名遇見的那個東西，其中 C_n 變成一個可預測的交易部位，而 DM_n 變成布朗運動的增量。現在就學會把 (C . M)_n 讀作「策略對賭局做積分」，等到連續時間版本登場時，會有極大的回報。而就今天而言，它更簡單、更生動：它就是你一回合一回合的本金。

定理：變換之後仍是鞅

這裡就是核心，那個粉碎賭徒夢想的結論。若 M 是鞅、C 是可預測的（且有界，或在別的意義下夠可積），則變換 (C . M) 仍是鞅，並且從零起步。這正是沒有押注系統能贏過公平賭局的精確陳述。無論你夢想出什麼可預測的方案——輸了就加倍、謹慎的平注、靠直覺孤注一擲——所得到的財富仍然是一場公平賭局。它在每一個未來時刻的期望值，都等於它現在的值，也就是零。就平均而言，你既不賺也不賠，沒了。

證明很短、且值得一看，因為它讓可預測性的角色變得透明。我們對 (C . M) 驗證鞅條件。變換的一步變化就是 C_(n+1) 乘以 DM_(n+1)。所以 E[(C . M)_(n+1) - (C . M)_n given F_n] = E[C_(n+1)(M_(n+1) - M_n) given F_n]。現在是關鍵的一步：C_(n+1) 是可預測的，所以在給定 F_n 之下它是已知的——就這個條件期望而言它形同一個常數，依取出已知者法則它可以滑到外面。剩下 C_(n+1) 乘以 E[M_(n+1) - M_n given F_n]，而因為 M 是鞅，裡頭那個期望是零。整個增量的條件均值是零，所以 (C . M) 是鞅。

把下一回合的獲利寫成單獨一項：(C . M)_(n+1) - (C . M)_n = C_(n+1) * (M_(n+1) - M_n)。
對那筆獲利取 E[ . given F_n]。因為 C_(n+1) 是可預測的，它是 F_n-已知的，可以從條件期望中提出來。
你剩下 C_(n+1) * E[M_(n+1) - M_n given F_n]。鞅性質使裡頭那個期望等於 0。
因此 E[(C . M)_(n+1) given F_n] = (C . M)_n：變換滿足鞅方程，再取一次普通期望就得到對每個 n 都有 E[(C . M)_n] = 0。

請精確注意可預測性是在哪裡發揮了作用：在第 2 步。倘若 C_(n+1) 只是可料的——被允許依賴第 n+1 回合的結果——它就不能從條件期望中提出來，整個論證便會崩潰。一個在決定賭注大小之前就看見結果的策略，不是策略，而是先見之明，先見之明當然會「贏過」賭局。這條定理對自己的假設很誠實：拿掉「不准偷看」這條規則，結論就不成立了。

為什麼鞅不會被擊潰：加倍法與其他幻覺

最有名的「系統」是加倍策略，在賭場裡也被混淆地暱稱為 martingale：押 1；若輸了，押 2；再輸，押 4，然後 8、16、...，直到你第一次贏，那一把就把先前所有的損失連本帶一個單位全部討回。它感覺像是穩賺不賠。而且嚴格說來，這套策略每一個完成的回合確實淨賺 +1。那為什麼它不會印鈔票？因為鞅變換在每一個有限時刻都是公平的：在任何固定的 n，E[(C . M)_n] = 0。那個幾乎必然的小贏 +1，恰好被一個罕見而巨大的損失抵銷——當一連串長長的連敗逼出一個你掏不出的賭注時。

這個幻覺完全活在「每一個有限時刻」與「在極限中」之間的縫隙裡。加倍法的玩家暗中假設了無限的資本與無限的時間。在一個真實、有限的本金之下，賭注終究會超過你所有的，那個讓你破產的連敗有著微小但為正的機率，於是期望結果又落回零。這也是一張貼在更深結論上的警告標籤：你下一篇會遇到的最佳停止定理說，即使在一個聰明選定的隨機停時，鞅依然公平——但這只在某些條件下成立（有界性，或一個有界的停時），而加倍策略正是刻意違反了這些條件。下一篇會把那些條件講清楚。

遠不止於賭博

若是離開鞅變換時，以為它只關乎賭場，那就太可惜了。完全相同的物件，正是數理金融的骨幹：把「賭注 C_n」換成「持有的股數」，把「增量 DM_n」換成「折現資產價格的變動」，則 (C . M)_n 就成了一個自融資交易策略的價值。「鞅的可預測變換仍是鞅」這條定理，換上那身衣服之後，說的正是：你無法從一個被公平定價的市場中賺得無風險利潤——這是無套利定價的根基。你現在理解的離散版本，到了連續時間就成為伊藤積分。

這個變換也能反向運轉，作為一種建造有用的鞅的方法，而不只是檢驗策略。你會倚重的一個核心構造是[[doob-martingale|杜布鞅]]：固定一個最終的隨機量，然後一次揭露一片關於它的資訊，令 M_n 等於「在至今所知之下、最終值的條件期望」。依塔性質，這自動就是一個鞅，再配上變換，便驅動了像 Azuma–Hoeffding 不等式這樣的集中結果。變換不只是一條「此路不通」的定理；它是一件工作坊裡的工具。

帶三件事走進下一篇。第一，一套押注／交易系統是一個可預測過程——在結果出現之前就拍板，但可以自由地依賴所有過去。第二，公平賭局被這樣一套系統所做的鞅變換 (C . M) 仍是公平的：在每一個有限的 n 都有 E[(C . M)_n] = 0，這正是「你贏不了公平賭局」的嚴謹形式。第三，加倍法的悖論，不是靠打破那份公平性來化解，而是靠「每一個有限時刻」與「極限」之間的縫隙來化解——而接下來登場的最佳停止定理，正是帶著明確的條件穿行於這道縫隙之中。