從一場賭局到一整個故事
前面幾階的一切都圍繞著單一的隨機變數 X,或固定的少數幾個。X 是一張快照:靠機會抽出的一個數字,配上一個描述可能取值散布情形的分配。但這個世界很少只給你一張快照。股價整天遊走;排隊人龍一分一秒地增減;賭徒的錢袋一注一注地起落。要為這些建模,我們需要的不是一個隨機數,而是一整列——其實是一整「族」——以時間為索引的隨機變數。那一族就是隨機過程。
嚴格地說,隨機過程是一族隨機變數 { X_t }——每個索引值 t 對應一個變數 X_t,全部定義在同一個底層機率空間上。索引 t 幾乎總是扮演時間的角色,所以我們把 X_t 讀作「系統在時刻 t 的狀態」。重點在於:我們並*不*假設這些 X_t 彼此獨立;過程在較晚時刻的行為與它先前所做的糾纏在一起,而捕捉這種「穿越時間的相依」,正是讓過程比一張各自分離的隨機變數清單更豐富的原因。
每個過程都需要的三樣東西:索引、狀態、路徑
要把一個過程確定下來,你必須說清楚三件事。第一是索引集:你容許的時刻 t 所成的集合。索引集可以是離散的——t = 0, 1, 2, 3, ... 對應每一注或每日收盤價——給出*離散時間*過程;也可以是連續區間,如 t >= 0 對應即時跳動的股價,給出*連續時間*過程。第二是狀態空間:每個 X_t 可取的值所成的集合。狀態空間可以是有限集(晴/雨)、整數(以整數美元計的你的錢袋),或全體實數(一個溫度)。光是(時間是離散或連續、狀態是離散或連續)這一對,就已經把過程粗分成幾大家族,連一條公式都還沒寫。
第三件——也是讓「過程」這個概念豁然開朗的畫面——是樣本路徑。固定一個結果 omega,也就是想像整場實驗已經從頭到尾跑了一次。那麼對這單一的 omega,每個 X_t(omega) 都成了一個實實在在的數字;當 t 掃過整個索引集,你便描出一整條曲線。那條曲線就是一條樣本路徑(也叫一次實現或一條軌跡):過程的一段可能的完整歷史。隨機變數對每個結果只給你一個數字,隨機過程對每個結果卻給你一整個*關於時間的函數*。
一個你能握在手裡的迷你具體過程
用最小的有趣例子把它變得具體。永遠地每秒擲一次公正硬幣。令 S_0 = 0,每一步正面加 +1、反面減 -1,於是 S_n 是你擲了 n 次後的累計總和。索引集是 t = 0, 1, 2, ...;狀態空間是整數;而一般記號裡的每個 X_n 就是這個 S_n。一條樣本路徑可能讀作 0, +1, 0, -1, 0, +1, +2, ...——一段一旦無限長的擲幣序列(結果 omega)被固定下來,便隨之確定的鋸齒狀歷史。這正是我們接下來要命名並研究的過程:簡單隨機漫步。
現在用兩道切片來讀它。固定時刻 n = 2、讓擲幣結果變動:S_2 是個樸素的隨機變數,以機率 1/4 取 +2(兩次正面)、以機率 1/2 取 0(一正一反)、以機率 1/4 取 -2(兩次反面)。這是垂直切片——一個分配。改為固定一個 omega,比方說擲幣序列 H, T, H, H, ...:此時路徑就是完全確定的鋸齒 0, +1, 0, +1, +2, ...。同一個過程,兩張面孔。
time n : 0 1 2 3 4 5 ... toss : H T H H T ... path S_n : 0 +1 0 +1 +2 +1 ... VERTICAL slice (fix n=2, vary the coins): S_2 = +2 with prob 1/4 S_2 = 0 with prob 1/2 S_2 = -2 with prob 1/4 HORIZONTAL slice (fix this omega, vary n): the one zig-zag path 0, +1, 0, +1, +2, +1, ...
一個過程如何被完整描述:有限維分配
一個過程裡含有無窮多個隨機變數,那我們究竟要怎麼寫下它完整的律?答案是這門學問的核心組織思想。我們從不需要一口氣掌握那個完整的無窮物件;只要知道對每一個有限的時刻清單 t_1, t_2, ..., t_k,向量 (X_{t_1}, X_{t_2}, ..., X_{t_k}) 的聯合分配就夠了。這些聯合律就是有限維分配,它們合起來便把過程確定下來。知道所有的有限維分配,在幾乎所有用途上,就等於知道了這個過程。
這些有限維分配不能隨意挑選;它們在重疊之處必須彼此相符。若你知道 (X_1, X_2, X_3) 的聯合律,而後只問 (X_1, X_3),那麼把 X_2 邊際積掉所得的答案,必須和直接計算 (X_1, X_3) 的律一致。這個「重疊處相符」的要求就是相容條件。柯爾莫哥洛夫延拓定理隨即給出一個漂亮的承諾:任何一族滿足相容的有限維分配,確實都來自一個活在單一機率空間上的真正隨機過程。所以你大可以只藉由指定一個過程在有限時窗內的行為來建構它——只要你保持相容即可。
三種值得留意的結構型態
當一個過程的有限維分配帶有額外結構時,它就變得好處理了。有三種型態——本階通篇都會研究——現在值得先點出名字。第一是平穩性:無論你從什麼時候開始觀看,過程在統計上看起來都一樣。嚴格地說,平穩性指的是把每個時刻都平移同一個量 h、得到 (X_{t_1+h}, ..., X_{t_k+h}) 之後,(X_{t_1}, ..., X_{t_k}) 的聯合律維持不變。一個較弱、卻極常見的近親只要求均值保持為常數,且自共變異數 Cov(X_s, X_t) 只依賴時間差 t - s、而不分別依賴 s 與 t——這正是時間序列建模的核心。
第二種型態關乎*增量*,也就是兩個時刻之間的跳躍 X_t - X_s。當不相交的時間段所產生的跳躍彼此獨立,且一個跳躍的分配只依賴時間區間的長度、而非它落在何處時,過程便具有獨立平穩增量。我們的擲幣漫步恰好就是這個味道:第 5 到第 8 步的變化,與第 1 到第 3 步的變化獨立,且只依賴經過了多少步。這個單一假設是你將遇到的最重要過程的種子——隨機漫步、卜瓦松過程與布朗運動全都由它長出來。
第三種、也是影響最深遠的型態,是馬可夫性質:一種遺忘。當一個過程在「已知其現值」的條件下,其未來與整段過去條件獨立時,它便是馬可夫的——現在的狀態已經總結了你預測下一步所需的一切。馬可夫性質並不是說未來與過去獨立;它說的是過去對未來的影響*只透過*現在傳遞。我們的漫步就遵守它:一旦有人告訴你「你此刻正站在 +3」,那條把你帶到這裡的路徑,對你的下一步不再提供任何額外資訊。這正是接下來幾階那些鏈與過程背後的引擎,它值得——也將會擁有——一篇專屬於它的指南。