JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

西格瑪代數與機率空間

前一篇指南讓你看到:你無法對一個區間的每一個子集合都一致地賦予機率。解方是誠實地說清楚「哪些集合是你獲准去量的」——而這份誠實的記帳,正是西格瑪代數的本質。

可量問題的清單

前一篇指南留給我們一個壞消息:沒有任何辦法能對 [0,1] 的每一個子集合都賦予一個既尊重平移、又尊重可數可加性的長度。存在著一個不可測集合,它會毀掉任何「量盡一切」的企圖。修正之道不是放棄機率——而是放棄「每個子集合都配得上一個機率」這個幻想。我們保留一份精挑細選的子集合清單,也就是那些我們願意稱為真正事件的集合,而我們只對清單上的成員賦予機率。

把一個事件想成關於隨機結果的一個「是或否」的問題:「飛鏢落在左半邊了嗎?」、「等待時間少於五分鐘嗎?」。可量問題的清單,就是那些我們承諾能用一個機率來回答的問題所成的集合。一個西格瑪代數(常以花體 F 表示)正是這樣的一份清單——但不是隨便哪份清單。它必須在我們組合問題的那些自然方式之下封閉,這樣一來,問出合理的後續問題就永遠不會把我們甩出清單之外。

相較於先前的階段,這是一個真正的態度轉變——在那裡你可以爽快地說「設 A 為任意事件」。在這裡,樣本空間是連同一個被選定的「獲准事件」族一起綁上來的。這一對(樣本空間、西格瑪代數)稱為一個可測空間,而它就是接下來整個機率論將要上演的舞台——甚至在賦予任何一個機率之前,舞台就已經架好了。

構成西格瑪代數的三條規則

樣本空間 Omega 的一個子集合族 F,若滿足以下三條規則,就稱為一個西格瑪代數。第一,整個空間 Omega 屬於 F(「有任何事發生嗎?」這個問題永遠可回答,答案是「有」)。第二,若集合 A 屬於 F,則其補集 Omega 減去 A 也屬於 F(若你能問「A 發生了嗎?」,你就能問「A 沒發生嗎?」)。第三——也是它的核心——若 A_1, A_2, A_3, …… 是 F 中的一列集合,則它們的聯集 A_1 聯集 A_2 聯集 …… 也屬於 F。關鍵在於,第三條規則允許「可數無限多」個集合,而不只是兩三個。

A sigma-algebra F over Omega satisfies:

  (1)  Omega is in F
  (2)  A in F          =>  (Omega \ A) in F        (complement)
  (3)  A_1, A_2, ... in F  =>  (A_1 u A_2 u ...) in F  (countable union)

Free consequences:
  - empty set is in F           (complement of Omega)
  - countable intersections in F (De Morgan: complement of a union)
三條公理,外加它們免費附送給你的東西:空集合,以及所有可數交集。

從這三條,你免費得到其餘的一切。空集合屬於 F,因為它是 Omega 的補集。可數交集屬於 F,因為根據德摩根定律,一個交集就是「補集們的聯集」的補集——而這三種運算全都待在 F 裡面。所以一個西格瑪代數自動在聯集、交集、補集與差集之下封閉,且這些運算可以取任意可數次。那個「可數無限」的伸展能力,正是把西格瑪代數和較簡單的事件代數區分開來的唯一特徵;後者只承諾在有限次運算下封閉。

兩個極端,與我們真正使用的那一個

對任何樣本空間,都有兩個平凡的西格瑪代數。最小的是 { 空集合, Omega }——它只能回答「有任何事發生嗎?」。最大的是冪集合,也就是所有子集合所成的族,它試圖回答一切可想像的問題。在有限或可數的 Omega 上——比方說一顆骰子或一串硬幣——冪集合是無害的,我們會毫不猶豫地使用它。麻煩只出現在像區間這樣的不可數空間上;正如上一篇所示,那裡的冪集合藏著不可測的怪物。

所以在實數線上,我們刻意使用介於兩個極端之間的東西:博雷爾西格瑪代數。它的配方很優雅。先從你真正在意的問題出發——每一個區間、每一個「X 小於 7 嗎?」——然後取「包含這些問題的最小西格瑪代數」。「包含的最小者」是一個貨真價實的運算:所有包含你那些起始問題的西格瑪代數,它們的交集本身就是一個西格瑪代數,而且是「仍能回答你所問一切」的最緊湊清單。這份被生成的清單,就是博雷爾集合。

回報是:博雷爾集合極為龐大——每一個區間、每一個開集與閉集、它們的每一個可數聯集與交集,乃至更為古怪的集合——但它們並非「一切」。前一篇裡那個不可測集合被刻意排除在外。我們是靠劃出一條界線換來了一致性,而博雷爾西格瑪代數正是我們劃下這條線的地方:豐富到足以容納你這輩子真正想要的每一個集合,精簡到永遠不會容納一個矛盾。

加上測度:機率空間

現在我們在舞台上放上份量。一個機率測度 P 是一個函數,它從 F 中取出一個集合,回傳一個落在 [0,1] 裡的數,並遵守你在第一個階段就遇過的柯爾莫哥洛夫公理——只是現在以完整的、測度論的眼光來看。第一,對每個事件 A,P(A) 至少為 0。第二,P(Omega) = 1:必有某事發生。第三,P 是可數可加的:若 A_1, A_2, …… 是兩兩互斥的事件,則 P(A_1 聯集 A_2 聯集 ……) 等於 P(A_1) + P(A_2) + …… 這個無窮和。

請留意西格瑪代數與測度是如何為彼此量身打造的。第三條公理,也就是可數可加性,談的是事件的一個可數聯集——而西格瑪代數保證這個聯集本身就是一個事件,所以 P 才有資格作用在它上面。「可量問題的清單」與「賦予機率的規則」並不是兩個各自獨立的決定;F 的封閉規則,正是使 P 的定義性質得以良定的東西。它們是同一部機器的兩半。

完整的物件——樣本空間、西格瑪代數、測度三者合一——就是機率空間,寫成三元組 (Omega, F, P)。本課程裡的每一個隨機事物,無論多麼精巧,最終都棲身於某個機率空間之上。一次擲硬幣、一條布朗運動軌跡、一個永遠運轉的排隊系統:每一個都只是這三樣材料的不同選擇罷了。當之後的指南說「設 X 為一隨機變數」時,底下總有這樣一個三元組在靜靜地運轉著。

這套新機制為你買到了什麼

這不只是整潔的記帳;這些公理是要幹活的。從可數可加性流出機率的連續性:若事件 A_1 包含於 A_2 包含於 A_3 …… 向上增長到一個極限事件 A,則 P(A_n) 攀升到 P(A);若事件向下收縮,P 也隨之收縮相符。正是這個性質讓你得以在機率裡面取極限——沒有它,你根本說不出「P(該數列終究超過 100)」等於那些機率的極限,而本階段裡的大數法則也就無立足之地了。

這裡有一個小巧卻驚人的紅利。在 [0,1] 上配上博雷爾集合、並以普通長度作為 P,那麼單一點 {x} 是一個合法的事件,而它的機率是 0——它的長度是零。然而整個區間,作為其所有點的聯集,機率卻是 1。這裡沒有矛盾,因為可加性只對可數的集族求和,而 [0,1] 的點是不可數的。這正是你好幾篇指南以來一直鬆散使用的一個事實的嚴格根基:對連續型變數而言,任何單一值的機率都是零,而密度是機率的「速率」,不是機率本身。

在實務中蓋一個出來

你幾乎從不用手去逐一指定 P 在每一個博雷爾集合上的值——它們有不可數那麼多。你的做法是:把 P 釘死在一個小巧、友善的生成集族上,再讓一條定理把它延拓到整個西格瑪代數。在實數線上,你只需宣告 P((負無窮, x]) = F(x),其中 F 就是你在先前階段早已認識的累積分配函數。這只對區間賦予了機率——但因為區間生成了博雷爾集合,恰好存在唯一一個與這個選擇相符的機率測度。你一路用到現在的那個累積分配函數,其實偷偷就是一整個測度的精簡指令集。

  1. 選定樣本空間 Omega——所有可能結果的集合(一顆骰子的六個面、區間 [0,1]、無窮硬幣序列的空間)。
  2. 選定西格瑪代數 F——若 Omega 可數就取冪集合,若 Omega 是實數線或區間就取博雷爾西格瑪代數。
  3. 只在簡單的生成集上指定 P:各個別結果的機率(離散情形),或透過累積分配函數令 P((負無窮, x]) = F(x)(連續情形)。
  4. 援引延拓定理:它保證在整個 F 上存在唯一一個與你的指定相符的測度,於是 (Omega, F, P) 至此完全被確定下來。

有了穩固就位的機率空間,下一篇指南終於能說清楚隨機變數究竟是什麼。它不是一個含糊的「會變的變數」——它是 Omega 上一個尊重西格瑪代數的函數,也就是一個可測函數。你能對這個隨機變數提出的每一個問題,都必須能追溯回清單 F 上既有的某個問題。我們在這裡細心搭起的舞台,正是讓那個定義唱得響亮的原因。