什麼是隨機過程？

從一場賭局到一整個故事

前面幾階的一切都圍繞著單一的隨機變數 X，或固定的少數幾個。X 是一張快照：靠機會抽出的一個數字，配上一個描述可能取值散布情形的分配。但這個世界很少只給你一張快照。股價整天遊走；排隊人龍一分一秒地增減；賭徒的錢袋一注一注地起落。要為這些建模，我們需要的不是一個隨機數，而是一整列——其實是一整「族」——以時間為索引的隨機變數。那一族就是隨機過程。

嚴格地說，隨機過程是一族隨機變數 { X_t }——每個索引值 t 對應一個變數 X_t，全部定義在同一個底層機率空間上。索引 t 幾乎總是扮演時間的角色，所以我們把 X_t 讀作「系統在時刻 t 的狀態」。重點在於：我們並*不*假設這些 X_t 彼此獨立；過程在較晚時刻的行為與它先前所做的糾纏在一起，而捕捉這種「穿越時間的相依」，正是讓過程比一張各自分離的隨機變數清單更豐富的原因。

每個過程都需要的三樣東西：索引、狀態、路徑

要把一個過程確定下來，你必須說清楚三件事。第一是索引集：你容許的時刻 t 所成的集合。索引集可以是離散的——t = 0, 1, 2, 3, ... 對應每一注或每日收盤價——給出*離散時間*過程；也可以是連續區間，如 t >= 0 對應即時跳動的股價，給出*連續時間*過程。第二是狀態空間：每個 X_t 可取的值所成的集合。狀態空間可以是有限集（晴／雨）、整數（以整數美元計的你的錢袋），或全體實數（一個溫度）。光是（時間是離散或連續、狀態是離散或連續）這一對，就已經把過程粗分成幾大家族，連一條公式都還沒寫。

第三件——也是讓「過程」這個概念豁然開朗的畫面——是樣本路徑。固定一個結果 omega，也就是想像整場實驗已經從頭到尾跑了一次。那麼對這單一的 omega，每個 X_t(omega) 都成了一個實實在在的數字；當 t 掃過整個索引集，你便描出一整條曲線。那條曲線就是一條樣本路徑（也叫一次實現或一條軌跡）：過程的一段可能的完整歷史。隨機變數對每個結果只給你一個數字，隨機過程對每個結果卻給你一整個*關於時間的函數*。

一個你能握在手裡的迷你具體過程

用最小的有趣例子把它變得具體。永遠地每秒擲一次公正硬幣。令 S_0 = 0，每一步正面加 +1、反面減 -1，於是 S_n 是你擲了 n 次後的累計總和。索引集是 t = 0, 1, 2, ...；狀態空間是整數；而一般記號裡的每個 X_n 就是這個 S_n。一條樣本路徑可能讀作 0, +1, 0, -1, 0, +1, +2, ...——一段一旦無限長的擲幣序列（結果 omega）被固定下來，便隨之確定的鋸齒狀歷史。這正是我們接下來要命名並研究的過程：簡單隨機漫步。

現在用兩道切片來讀它。固定時刻 n = 2、讓擲幣結果變動：S_2 是個樸素的隨機變數，以機率 1/4 取 +2（兩次正面）、以機率 1/2 取 0（一正一反）、以機率 1/4 取 -2（兩次反面）。這是垂直切片——一個分配。改為固定一個 omega，比方說擲幣序列 H, T, H, H, ...：此時路徑就是完全確定的鋸齒 0, +1, 0, +1, +2, ...。同一個過程，兩張面孔。

time  n :   0    1    2    3    4    5   ...
toss     :        H    T    H    H    T  ...
path S_n :   0   +1    0   +1   +2   +1  ...

VERTICAL slice  (fix n=2, vary the coins):
   S_2 = +2  with prob 1/4
   S_2 =  0  with prob 1/2
   S_2 = -2  with prob 1/4

HORIZONTAL slice (fix this omega, vary n):
   the one zig-zag path  0, +1, 0, +1, +2, +1, ...

同一條擲幣漫步，分別看成垂直切片（固定時刻的一個分配）與水平切片（單一條樣本路徑）。

一個過程如何被完整描述：有限維分配

一個過程裡含有無窮多個隨機變數，那我們究竟要怎麼寫下它完整的律？答案是這門學問的核心組織思想。我們從不需要一口氣掌握那個完整的無窮物件；只要知道對每一個有限的時刻清單 t_1, t_2, ..., t_k，向量 (X_{t_1}, X_{t_2}, ..., X_{t_k}) 的聯合分配就夠了。這些聯合律就是有限維分配，它們合起來便把過程確定下來。知道所有的有限維分配，在幾乎所有用途上，就等於知道了這個過程。

這些有限維分配不能隨意挑選；它們在重疊之處必須彼此相符。若你知道 (X_1, X_2, X_3) 的聯合律，而後只問 (X_1, X_3)，那麼把 X_2 邊際積掉所得的答案，必須和直接計算 (X_1, X_3) 的律一致。這個「重疊處相符」的要求就是相容條件。柯爾莫哥洛夫延拓定理隨即給出一個漂亮的承諾：任何一族滿足相容的有限維分配，確實都來自一個活在單一機率空間上的真正隨機過程。所以你大可以只藉由指定一個過程在有限時窗內的行為來建構它——只要你保持相容即可。

三種值得留意的結構型態

當一個過程的有限維分配帶有額外結構時，它就變得好處理了。有三種型態——本階通篇都會研究——現在值得先點出名字。第一是平穩性：無論你從什麼時候開始觀看，過程在統計上看起來都一樣。嚴格地說，平穩性指的是把每個時刻都平移同一個量 h、得到 (X_{t_1+h}, ..., X_{t_k+h}) 之後，(X_{t_1}, ..., X_{t_k}) 的聯合律維持不變。一個較弱、卻極常見的近親只要求均值保持為常數，且自共變異數 Cov(X_s, X_t) 只依賴時間差 t - s、而不分別依賴 s 與 t——這正是時間序列建模的核心。

第二種型態關乎*增量*，也就是兩個時刻之間的跳躍 X_t - X_s。當不相交的時間段所產生的跳躍彼此獨立，且一個跳躍的分配只依賴時間區間的長度、而非它落在何處時，過程便具有獨立平穩增量。我們的擲幣漫步恰好就是這個味道：第 5 到第 8 步的變化，與第 1 到第 3 步的變化獨立，且只依賴經過了多少步。這個單一假設是你將遇到的最重要過程的種子——隨機漫步、卜瓦松過程與布朗運動全都由它長出來。

第三種、也是影響最深遠的型態，是馬可夫性質：一種遺忘。當一個過程在「已知其現值」的條件下，其未來與整段過去條件獨立時，它便是馬可夫的——現在的狀態已經總結了你預測下一步所需的一切。馬可夫性質並不是說未來與過去獨立；它說的是過去對未來的影響*只透過*現在傳遞。我們的漫步就遵守它：一旦有人告訴你「你此刻正站在 +3」，那條把你帶到這裡的路徑，對你的下一步不再提供任何額外資訊。這正是接下來幾階那些鏈與過程背後的引擎，它值得——也將會擁有——一篇專屬於它的指南。