只會增長的資訊:濾子
再把這一級走一遍。隨機過程是一族隨時間展開的隨機變數 X_0、X_1、X_2、...,而一條樣本路徑是你可能真正觀測到的一整段軌跡。即時看著它,隨著時鐘滴答你會知道得越來越多:第 3 步之後你知道 X_0、X_1、X_2、X_3,但 X_4 仍藏著。本篇第一件工作,就是把這份逐步累積的知識化為一個精確的數學物件,因為幾乎每個有趣的問題——「我該何時停?」「未來是否依賴過去?」——骨子裡都是「你在何時知道了什麼」的問題。
我們把時刻 n 可用的資訊打包成一個 sigma-代數 F_n——它是你只憑「截至時刻 n 所見」就能判定是非的所有事件之集合。整條遞增的鏈 F_0 ⊆ F_1 ⊆ F_2 ⊆ ... 稱為 濾子(filtration),而那些包含關係正是核心:資訊永不被丟棄,只會累積。一個過程若在每個時刻 n 其值 X_n 都已能由 F_n 判定——亦即 X_n 對 F_n 可測——就稱它對該濾子是 適應的(adapted)。一個過程的自然濾子,就是讓它適應的最小濾子:F_n 恰好記錄歷史 X_0、...、X_n,別無其他。見 濾子與適應過程。
決定何時停——而不偷看
在前幾篇你看著一條簡單隨機漫步遊蕩,並問了像「它何時首次擊中 0?」這樣的問題;或在賭徒破產中問「財富何時首次達到 0 或 N?」。每個這樣的問題都命名了一個隨機時間 T——隨機是因為它取決於你恰好抽到的那條路徑。但並非每個隨機時間都能公平地使用。一條正當的停止規則必須能 *邊走邊判定*:在每一刻你都該能只憑所見說出「現在停」或「繼續走」,絕不靠瞥見未來。
這正是 停時(stopping time) 所捕捉的。一個隨機時間 T 相對於某濾子是停時,如果對每個 n,事件 {T = n} 都屬於 F_n——亦即「你是否已在時刻 n 之前停下」可由時刻 n 可用的資訊判定。「漫步首次擊中 0 的時刻」是停時:每一步你都能查看自己是否已經抵達。「時刻 100 之前漫步最後一次為正的時刻」就 *不是* 停時,因為要知道它是 *最後* 一次,你必須往前偷看、確認漫步再也不回來——而這在它發生的當下你並不具備這份知識。
stopping time T <=> for every n, {T = n} is in F_n
(equivalently, {T <= n} is in F_n)
first hitting time of a set A:
T = min { n >= 0 : X_n is in A }
-> always a stopping time, because deciding {T = n}
only needs X_0, X_1, ..., X_n (all in F_n)停時為何值得:選擇性停止定理
停時不只是記帳——它把困難的路徑問題化為一行計算。回想公正的 +/-1 漫步是一個 鞅(一個鞅是這樣的過程:在給定過去之下,它下一個值的條件期望等於當前值,是一場完全公平的賽局,即 E[M_(n+1) given F_n] = M_n)。選擇性停止定理(optional stopping theorem) 說:在適當條件下,即使你在某個聰明的隨機時刻 T 停下,這份公平依然存活:E[M_T] = E[M_0]。換言之,沒有任何誠實的停止規則能改變公平賽局的期望值。見選擇性停止定理與相對於濾子的鞅。
看它如何一招化解賭徒破產。讓一條公正漫步從財富 k 出發,在 0 與 N 處設吸收壁,令 T 為它首次擊中其一的時刻——一個停時。選擇性停止給出 k = E[M_0] = E[M_T]。但在時刻 T,財富恰為 0 或 N,所以 E[M_T] = 0·P(破產) + N·P(達到 N) = N·P(達到 N)。令兩者相等,得 P(達到 N) = k/N。你在賭徒破產那篇遇到的乾淨答案就這樣掉了出來——不必遞迴、不必磨代數,只靠公平性透過一條誠實停止規則的守恆。
會遺忘的過程:馬可夫性質
第三根支柱關乎 *對過去的依賴*。有些過程隨身扛著整段歷史;有些只在乎此刻身在何處。一個過程具有 馬可夫性質(Markov property),如果在給定當前狀態之下,未來與過去獨立:知道整段歷史 X_0、...、X_n,所告訴你關於 X_(n+1) 的,並不比單憑 X_n 所告訴你的更多。以符號寫,P(X_(n+1) = j given X_0, ..., X_n) = P(X_(n+1) = j given X_n)。當下是一份充分的摘要;你走來的那條路,對你接下來去哪裡無關緊要。見馬可夫性質。
我們的隨機漫步是最友善的例子。它的下一個位置是當前位置加上一個全新的 +/-1 步,而那一步與之前的一切獨立——所以未來只透過當前位置依賴過去。這就是馬可夫性質的現身,也正是為什麼我們能用轉移矩陣分析這條漫步並稱它為離散時間馬可夫鏈:移動的規則只依賴當前狀態,而從不依賴它身後那串狀態的軌跡。同一份遺忘也支撐著連續時間裡的指數分配的無記憶性——一個無論已等待多久、都從頭開始等待的過程。
三者交會處:強馬可夫性質
現在把這幾股線編在一起。普通的馬可夫性質說過程能從一個 *固定* 時刻 n 乾淨地重啟。但最有力的論證需要它能從一個 *隨機* 時刻重啟——而且不是任意隨機時刻,而是一個停時,一個不偷看就選定的時刻。強馬可夫性質(strong Markov property) 表明:一個馬可夫過程從停時 T 重新開始,就如同從固定時刻開始一般:在給定 X_T = i 之下,未來的 X_(T+1)、X_(T+2)、... 像一個從 i 起步的全新過程副本那樣演化,且與通向 T 的那段路徑獨立。見強馬可夫性質。
為何「強」需要停時,而非任意隨機時間?因為若 T 可以偷看未來,對 X_T 取條件就可能夾帶關於即將到來之事的資訊,於是「全新重啟」的圖像便會崩塌。停時條件恰恰保證了:在我們重啟的那一刻,我們知道自己已經抵達,卻對前方路徑一無不正當的所知。這就是為什麼本篇三個概念是同一個包裹:濾子定義了「至今」的意思,停時是它內部一個誠實的隨機瞬間,而強馬可夫性質則是回報——一份連在尊重歷史的隨機重啟下都存活的無記憶性。
- 固定一個濾子 F_n——「截至時刻 n 已知之物」不斷增長的紀錄——並檢查你的過程對它是適應的。
- 辨認一個停時 T(例如某個首達時):確認 {T = n} 可由 F_n 判定,且不偷看未來。
- 若過程是馬可夫的,引用強馬可夫性質:自 T 起它表現得像一個從狀態 X_T 起步的全新副本。
- 若它同時是鞅,檢查選擇性停止的條件,並讀出 E[M_T] = E[M_0],一行內回答那個路徑問題。