一次執行畫出一整條曲線
在前一篇裡,隨機過程被介紹為一族以時間 t 為索引的隨機變數 {X_t},全都活在同一個樣本空間上。此刻最重要的一次思維轉換是:當你把實驗執行「一次」——選定一個底層結果 omega——你得到的不是單一數字,而是一整個關於時間的函數。對應規則 t -> X_t(omega) 描出一條曲線,這條曲線就叫做樣本路徑(也稱實現或軌跡)。一個 omega,一整條路徑。
請同時在腦中持有兩種互補的視角。把時間 t 凍住,橫看所有結果:X_t 是一個普通的隨機變數,有它自己的平均值 E[X_t] 與自己的分配,正是前幾階那些物件。反過來,把結果 omega 凍住、讓時間流動:你看到的是一條樣本路徑,一段具體的歷史。整個過程就是所有這類路徑構成的「雲」,按各自的機率加權。一張每日股價圖、一條雜訊導線上抖動的電壓、到時刻 t 為止已抵達的公車數——你見過的每一張「某物隨時間隨機變化」的圖,都是從那團雲中抽出的「一條」樣本路徑。
如何指定一個過程:有限維分配
一條路徑是一個有無窮多座標的物件,每一瞬間一個座標。我們怎麼可能釘住這種東西的法則?答案出奇地節省:我們從不一次看遍所有瞬間。我們只指定有限多個快照的聯合分配。任取一組有限的時刻 t_1 < t_2 < ... < t_n,問向量 (X_{t_1}, X_{t_2}, ..., X_{t_n}) 的聯合法則。這一族聯合法則——每一種有限的時刻選法各一個——構成有限維分配,而它正是真正定義這個過程的東西。
這些片段不能各自亂選;它們在重疊之處必須彼此相符。有限維分配服從一個相容性條件:若你取 (X_{t_1}, X_{t_2}, X_{t_3}) 的聯合法則,把中間那個座標積掉(邊緣化),你必須恰好還原出 (X_{t_1}, X_{t_3}) 的聯合法則。這正是我們在普通聯合分配那裡見過的同一個要求——由較大的圖算出的邊緣,必須吻合較小的圖——如今橫跨時間來施行。它的深層回報是柯爾莫哥洛夫延拓定理:任何滿足此相容性條件的有限維法則族,確實都來自路徑空間上一個如假包換的過程。因此相容性恰恰是入場券,一旦付清,你便能從有限的影子搭出整個無窮的物件。
現在有一個誠實的侷限值得點明。有限維分配固定了任何有限組時刻上的情形,但它們本身並不能釘住那些「同時」依賴連續多個時刻的性質——例如樣本路徑是否連續,或某條路徑在何處達到最大值。兩個過程可以共享每一個有限維分配,路徑行為卻天差地別。這就是為什麼對連續時間過程,我們會在有限維法則「之上」另外要求路徑性質(如連續性);光憑那些快照,並非故事的全部。
平穩性:拒絕老去的統計量
許多過程不論你「何時」開始觀看,統計上看起來都一樣。錄音裡的背景嘶聲、扣除季節趨勢後的每日氣溫距平、達到穩態的排隊隊伍——把時鐘往前撥一小時,其機率行為毫無改變。這種對時間平移的不變性就是平穩性,它是一個過程所能擁有最有用的簡化結構之一。強的版本,嚴格平穩,說的是整個法則都對平移不變:對任意一組時刻與任意延遲 h,向量 (X_{t_1}, ..., X_{t_n}) 與平移後的向量 (X_{t_1 + h}, ..., X_{t_n + h}) 有相同的聯合分配。
嚴格平穩要求很高——它約束了每一個有限維分配——所以實務上我們倚靠一個較弱、可檢驗的表親。一個過程若僅其前兩個動差不隨時間改變,便稱為弱平穩(或廣義平穩):平均值 E[X_t] 對所有 t 都是同一個常數,而兩個時刻間的共變異數只取決於它們之間的間距、與它們落在何處無關。這個只看間距的共變異數就是自共變異數函數 gamma(h) = Cov(X_t, X_{t+h})。對一個平穩過程而言,gamma(h) 只是延遲 h 的函數。請注意這關係是單向的:嚴格平穩(再加上有限變異數)蘊含弱平穩,但一個弱平穩過程不必然嚴格平穩,因為對齊兩個動差並不能對齊整個分配。
自共變異數函數才是你實際會去計算的主力。三個事實讓它易讀。在延遲為零時它就是變異數,gamma(0) = Var(X_t),對平穩過程而言是一個固定的數。它是對稱的,gamma(-h) = gamma(h),因為共變異數不在乎先後順序。而除以變異數便得到自相關 rho(h) = gamma(h)/gamma(0),一個落在 [-1, 1] 的數,衡量「此刻的值」對「h 步之後的值」的預測力有多強。一個迷你例子:若相鄰每日距平的變異數為 4 而 Cov(X_t, X_{t+1}) = 2,則 rho(1) = 2/4 = 0.5——今天的距平對明天有半個單位的線性牽引力。
增量:過程規律的另一種方式
平穩性馴服的是一個過程的「水位」;另一個重要的結構性假設馴服的是它的「變化」。一個增量是某段區間上的變化,X_t - X_s(其中 s < t)——過程在兩個時刻之間移動了多少。一大族重要的過程,是藉由要求這些增量在兩個特定方面表現良好而建立的,這個組合就叫做獨立平穩增量。
兩個條款,要小心地分開。獨立增量:互不重疊的時間區間上的變化是彼此獨立的隨機變數——過程在下午一點到兩點之間做了什麼,對它在下午五點到六點之間做什麼一無所示。平穩增量:一個增量的分配只取決於區間的「長度」,與它落在何處無關——任何一小時窗口上的變化都有相同的法則,不論那窗口從正午還是午夜開始。請留意這個微妙處:「平穩增量」說的是增量的分配,與「過程本身平穩」是相當不同的兩回事。一個過程可以一面有平穩增量、一面穩定地向上漂移,那它在水位上顯然並不平穩。
Disjoint intervals on the time line:
---[ s1 .... t1 ]--------[ s2 .... t2 ]---> time
change A change B
Independent increments: A and B are independent.
Stationary increments: law of (X_t - X_s) depends only on (t - s).
Do NOT confuse with the process being stationary
(that is about X_t's levels, not its changes).這兩個條款是本階其餘部分的引擎室。把它們加到一個每一刻邁出 +1 或 -1 整數步的過程上,你便得到簡單隨機漫步,也就是下一篇的主角:每一步都是一個獨立、同分配的跳動,因此走了 n 步後的位置不過是一連串獨立移動的累計總和。把同樣的條款加到一個計數過程上,你得到卜瓦松過程;再以常態分配的增量加上連續性要求,往後就得到布朗運動。數學之所以一致,是因為結構相同——獨立平穩增量把一個過程變成一串嶄新、可互換的驚奇之整潔累積。
把一個過程讀好
把這些片段拼起來,你就握有一套能對付任何過程的實用工具箱。首先定位樣本路徑:它是一個實現、一段歷史,不是法則。接著記得,法則本身由有限維分配捕捉,而這些分配必須滿足相容性條件才算合法。然後檢查兩個彼此獨立的重大結構問題。它平穩嗎——由平均與自共變異數函數所概括的水位統計量,是否拒絕依賴絕對時間?以及它是否具有獨立和/或平穩增量——它的變化是否為可互換、互不干擾的片段之乾淨累積?
- 辨明索引集合與狀態空間,然後勾出一條樣本路徑,提醒自己你看的是「一個」實現,而非整個法則。
- 把法則寫成所選時間快照上的有限維分配,並確認它們能相容地邊緣化(相容性條件)。
- 檢驗平穩性:E[X_t] 是否為常數,而 Cov(X_t, X_{t+h}) 是否只依賴延遲 h?若是,就用自共變異數函數 gamma(h) 概括其二階行為。
- 另外檢驗增量:互不重疊區間上的變化是否獨立,且 X_t - X_s 的法則是否只依賴 t - s?獨立平穩增量會把你引向隨機漫步與卜瓦松型過程。
請帶著一個誠實的提醒前行。真實資料只交給你「一條」樣本路徑,然而上述那些問題問的是整個路徑系綜——問的是法則。唯有當過程夠規矩、使得沿路徑的時間平均能代替橫跨路徑的系綜平均時,我們才能從一條路徑估計平穩性或自共變異數;那是遍歷性的觀念,而它是一個額外的假設,不是免費的禮物。把路徑與法則在心中分清楚,下一篇的隨機漫步讀起來就會恰如其本質:獨立平穩增量的加總。