西格瑪代數與機率空間

可量問題的清單

前一篇指南留給我們一個壞消息：沒有任何辦法能對 [0,1] 的每一個子集合都賦予一個既尊重平移、又尊重可數可加性的長度。存在著一個不可測集合，它會毀掉任何「量盡一切」的企圖。修正之道不是放棄機率——而是放棄「每個子集合都配得上一個機率」這個幻想。我們保留一份精挑細選的子集合清單，也就是那些我們願意稱為真正事件的集合，而我們只對清單上的成員賦予機率。

把一個事件想成關於隨機結果的一個「是或否」的問題：「飛鏢落在左半邊了嗎？」、「等待時間少於五分鐘嗎？」。可量問題的清單，就是那些我們承諾能用一個機率來回答的問題所成的集合。一個西格瑪代數（常以花體 F 表示）正是這樣的一份清單——但不是隨便哪份清單。它必須在我們組合問題的那些自然方式之下封閉，這樣一來，問出合理的後續問題就永遠不會把我們甩出清單之外。

相較於先前的階段，這是一個真正的態度轉變——在那裡你可以爽快地說「設 A 為任意事件」。在這裡，樣本空間是連同一個被選定的「獲准事件」族一起綁上來的。這一對（樣本空間、西格瑪代數）稱為一個可測空間，而它就是接下來整個機率論將要上演的舞台——甚至在賦予任何一個機率之前，舞台就已經架好了。

構成西格瑪代數的三條規則

樣本空間 Omega 的一個子集合族 F，若滿足以下三條規則，就稱為一個西格瑪代數。第一，整個空間 Omega 屬於 F（「有任何事發生嗎？」這個問題永遠可回答，答案是「有」）。第二，若集合 A 屬於 F，則其補集 Omega 減去 A 也屬於 F（若你能問「A 發生了嗎？」，你就能問「A 沒發生嗎？」）。第三——也是它的核心——若 A_1, A_2, A_3, …… 是 F 中的一列集合，則它們的聯集 A_1 聯集 A_2 聯集 …… 也屬於 F。關鍵在於，第三條規則允許「可數無限多」個集合，而不只是兩三個。

A sigma-algebra F over Omega satisfies:

  (1)  Omega is in F
  (2)  A in F          =>  (Omega \ A) in F        (complement)
  (3)  A_1, A_2, ... in F  =>  (A_1 u A_2 u ...) in F  (countable union)

Free consequences:
  - empty set is in F           (complement of Omega)
  - countable intersections in F (De Morgan: complement of a union)

三條公理，外加它們免費附送給你的東西：空集合，以及所有可數交集。

從這三條，你免費得到其餘的一切。空集合屬於 F，因為它是 Omega 的補集。可數交集屬於 F，因為根據德摩根定律，一個交集就是「補集們的聯集」的補集——而這三種運算全都待在 F 裡面。所以一個西格瑪代數自動在聯集、交集、補集與差集之下封閉，且這些運算可以取任意可數次。那個「可數無限」的伸展能力，正是把西格瑪代數和較簡單的事件代數區分開來的唯一特徵；後者只承諾在有限次運算下封閉。

兩個極端，與我們真正使用的那一個

對任何樣本空間，都有兩個平凡的西格瑪代數。最小的是 { 空集合, Omega }——它只能回答「有任何事發生嗎？」。最大的是冪集合，也就是所有子集合所成的族，它試圖回答一切可想像的問題。在有限或可數的 Omega 上——比方說一顆骰子或一串硬幣——冪集合是無害的，我們會毫不猶豫地使用它。麻煩只出現在像區間這樣的不可數空間上；正如上一篇所示，那裡的冪集合藏著不可測的怪物。

所以在實數線上，我們刻意使用介於兩個極端之間的東西：博雷爾西格瑪代數。它的配方很優雅。先從你真正在意的問題出發——每一個區間、每一個「X 小於 7 嗎？」——然後取「包含這些問題的最小西格瑪代數」。「包含的最小者」是一個貨真價實的運算：所有包含你那些起始問題的西格瑪代數，它們的交集本身就是一個西格瑪代數，而且是「仍能回答你所問一切」的最緊湊清單。這份被生成的清單，就是博雷爾集合。

回報是：博雷爾集合極為龐大——每一個區間、每一個開集與閉集、它們的每一個可數聯集與交集，乃至更為古怪的集合——但它們並非「一切」。前一篇裡那個不可測集合被刻意排除在外。我們是靠劃出一條界線換來了一致性，而博雷爾西格瑪代數正是我們劃下這條線的地方：豐富到足以容納你這輩子真正想要的每一個集合，精簡到永遠不會容納一個矛盾。

加上測度：機率空間

現在我們在舞台上放上份量。一個機率測度 P 是一個函數，它從 F 中取出一個集合，回傳一個落在 [0,1] 裡的數，並遵守你在第一個階段就遇過的柯爾莫哥洛夫公理——只是現在以完整的、測度論的眼光來看。第一，對每個事件 A，P(A) 至少為 0。第二，P(Omega) = 1：必有某事發生。第三，P 是可數可加的：若 A_1, A_2, …… 是兩兩互斥的事件，則 P(A_1 聯集 A_2 聯集 ……) 等於 P(A_1) + P(A_2) + …… 這個無窮和。

請留意西格瑪代數與測度是如何為彼此量身打造的。第三條公理，也就是可數可加性，談的是事件的一個可數聯集——而西格瑪代數保證這個聯集本身就是一個事件，所以 P 才有資格作用在它上面。「可量問題的清單」與「賦予機率的規則」並不是兩個各自獨立的決定；F 的封閉規則，正是使 P 的定義性質得以良定的東西。它們是同一部機器的兩半。

完整的物件——樣本空間、西格瑪代數、測度三者合一——就是機率空間，寫成三元組 (Omega, F, P)。本課程裡的每一個隨機事物，無論多麼精巧，最終都棲身於某個機率空間之上。一次擲硬幣、一條布朗運動軌跡、一個永遠運轉的排隊系統：每一個都只是這三樣材料的不同選擇罷了。當之後的指南說「設 X 為一隨機變數」時，底下總有這樣一個三元組在靜靜地運轉著。

這套新機制為你買到了什麼

這不只是整潔的記帳；這些公理是要幹活的。從可數可加性流出機率的連續性：若事件 A_1 包含於 A_2 包含於 A_3 …… 向上增長到一個極限事件 A，則 P(A_n) 攀升到 P(A)；若事件向下收縮，P 也隨之收縮相符。正是這個性質讓你得以在機率裡面取極限——沒有它，你根本說不出「P(該數列終究超過 100)」等於那些機率的極限，而本階段裡的大數法則也就無立足之地了。

這裡有一個小巧卻驚人的紅利。在 [0,1] 上配上博雷爾集合、並以普通長度作為 P，那麼單一點 {x} 是一個合法的事件，而它的機率是 0——它的長度是零。然而整個區間，作為其所有點的聯集，機率卻是 1。這裡沒有矛盾，因為可加性只對可數的集族求和，而 [0,1] 的點是不可數的。這正是你好幾篇指南以來一直鬆散使用的一個事實的嚴格根基：對連續型變數而言，任何單一值的機率都是零，而密度是機率的「速率」，不是機率本身。

在實務中蓋一個出來

你幾乎從不用手去逐一指定 P 在每一個博雷爾集合上的值——它們有不可數那麼多。你的做法是：把 P 釘死在一個小巧、友善的生成集族上，再讓一條定理把它延拓到整個西格瑪代數。在實數線上，你只需宣告 P((負無窮, x]) = F(x)，其中 F 就是你在先前階段早已認識的累積分配函數。這只對區間賦予了機率——但因為區間生成了博雷爾集合，恰好存在唯一一個與這個選擇相符的機率測度。你一路用到現在的那個累積分配函數，其實偷偷就是一整個測度的精簡指令集。

選定樣本空間 Omega——所有可能結果的集合（一顆骰子的六個面、區間 [0,1]、無窮硬幣序列的空間）。
選定西格瑪代數 F——若 Omega 可數就取冪集合，若 Omega 是實數線或區間就取博雷爾西格瑪代數。
只在簡單的生成集上指定 P：各個別結果的機率（離散情形），或透過累積分配函數令 P((負無窮, x]) = F(x)（連續情形）。
援引延拓定理：它保證在整個 F 上存在唯一一個與你的指定相符的測度，於是 (Omega, F, P) 至此完全被確定下來。

有了穩固就位的機率空間，下一篇指南終於能說清楚隨機變數究竟是什麼。它不是一個含糊的「會變的變數」——它是 Omega 上一個尊重西格瑪代數的函數，也就是一個可測函數。你能對這個隨機變數提出的每一個問題，都必須能追溯回清單 F 上既有的某個問題。我們在這裡細心搭起的舞台，正是讓那個定義唱得響亮的原因。