我們所說的「隨機」是什麼意思
機率始於一個看似簡單的想法:一個我們無法確定地預測其結果,但能描述其所有可能結果的情境。我們稱之為隨機試驗——並不是因為牽涉到實驗室,而是因為在它發生之前,確實有不只一種結果擺在檯面上。擲一枚硬幣、丟一顆骰子、等著看午餐前會收到幾封電子郵件:在這個意義下,每一個都是隨機試驗。
這裡誠實很重要。「隨機」並不代表無法無天或沒有原因。被拋出的硬幣完美地遵守物理定律;若我們精確知道每一道力與每一個角度,原則上就能預測哪一面朝上。我們之所以稱它為隨機,是因為實務上我們缺乏那些資訊,而結果又對我們無法測量的細節極為敏感。機率正是在這種不確定性下謹慎推理的數學——它並不是在主張宇宙在擲骰子。
樣本空間:把所有可能發生的事列出來
任何機率問題的第一步,是把舞台寫下來。樣本空間通常以希臘字母 Omega 表示,是試驗所有可能結果所成的集合——而關鍵在於,這些結果必須彼此互斥且窮盡:每一次恰好有其中一個會發生。其中的每一個單一結果就是一個樣本點(結果)。對一顆骰子而言,Omega = {1, 2, 3, 4, 5, 6};對一枚硬幣而言,Omega = {正面, 反面}。
樣本空間是一種選擇,而不是別人交給你的既定事實,而選得好就贏了一半。假設你拋兩枚硬幣。如果你只在乎出現幾個正面,也許會用 Omega = {0, 1, 2};但若你在乎順序,較乾淨的空間是 Omega = {HH, HT, TH, TT},四個同樣自然的結果。第二種描述更豐富:由它你能還原第一種(一個正面就是 HT 或 TH),反過來卻不行。一個好的經驗法則是:選擇仍能回答你問題的最細緻描述——之後你隨時可以把結果再分組起來。
事件:我們能提出的問題
結果是實際發生的事;事件則是當我們看到結果後便能回答的一個問題。形式上,事件就是樣本空間的一個子集——一群被我們歸在一起的結果,因為它們共享我們所在乎的某個性質。對一顆骰子而言,「結果是偶數」就是事件 {2, 4, 6};「結果至少是 5」就是 {5, 6};「結果是 3」則是只含單一結果的事件 {3},我們稱之為基本事件。
這個子集的圖像是初等機率中最有用的單一心智意象,因為它悄悄地把日常語言的字句翻譯成集合論的運算。「A 與 B 同時發生」變成交集 A and B(同時落在兩個子集中的結果);「A 或 B 發生」變成聯集 A or B(落在任一子集中的結果);「A 沒有發生」變成 A 的補集(Omega 中位於 A 之外的一切)。我們說事件 A 發生,恰好就是當真正出現的結果落在子集 A 之內的時候。
有兩個特殊事件位於整個集合的兩端。整個樣本空間 Omega 是必然事件——無論發生什麼,結果都落在 Omega 之中,所以它總會發生;空集合則是不可能事件——它不含任何結果,因此永遠不會發生。你被允許談論的所有事件所構成的整個族系,連同它們在「且、或、補」之下如何組合,合稱為事件代數,而把它好好整理清楚,正是緊接著下一篇導讀的主題。
當兩個事件無法同時發生
當兩個事件不共享任何結果時,它們稱為互斥的(或不相交)——它們的交集是空集合,因此在同一次試驗中無法同時發生。在一顆骰子上,「結果是偶數」與「結果是 3」是互斥的:沒有任何結果同時屬於兩者。這是關於這些子集的一項結構性事實,光看它們是否重疊就能判定。
互斥之所以重要,正是因為它恰好是機率可以直接相加的條件。若 A 與 B 不能同時發生,則 P(A or B) = P(A) + P(B),沒有任何修正項。當它們可能重疊時,你必須扣掉被重複計算的中間部分——這就是下一篇所要發展的排容原理的概念。現在只要記住這個圖像即可:不相交的子集肩並肩地疊放,它們的大小可以乾淨地相加。
從集合到數字:機率的第一口滋味
以上這些關於集合的討論是骨架;機率則是我們覆上的血肉。機率是一個規則,把介於 0 與 1 之間的一個數字指派給每個事件,用以衡量我們有多強烈地預期該事件發生。那個誠實、以公理為基礎的規則定義,是本階段第 3 篇導讀的工作;在此我們只認識最友善的特例,那個能給出正確直覺的特例。
當樣本空間有限,而且我們有一個對稱性論證說明每個結果同樣可能發生時——公平的骰子、平衡的硬幣、洗勻的一副牌——機率的古典定義告訴我們:一個事件的機率,就是屬於它的結果所佔的比例。以符號表示,P(A) =(A 中的結果數)/(Omega 中的結果數)。機率於是化為計數,這也正是本階梯緊接著的下一階段專門講巧妙計數的原因。
Omega = {1,2,3,4,5,6} (a fair die, 6 outcomes)
A = "even" = {2,4,6} P(A) = 3/6 = 1/2
B = "at least 5"= {5,6} P(B) = 2/6 = 1/3
A and B = {6} P(A and B) = 1/6
A or B = {2,4,5,6} P(A or B) = 4/6 = 2/3
check: P(A)+P(B)-P(A and B) = 3/6 + 2/6 - 1/6 = 4/6 (they overlap at 6)有一個提醒要帶往後續:古典的這套配方只在「同樣可能」確實成立時才有效,而這通常要靠對稱性來保證。對於一枚被折彎的硬幣、一顆灌鉛的骰子,或「明天會不會下雨」這類沒有任何兩個結果可以互換的情形,它就無話可說。僅僅因為你把結果列了出來就把它們當成同樣可能,是一個經典的錯誤——樣本空間的選法可能讓結果看起來均勻,實則不然。當對稱性失效時,一個機率數字究竟意味著什麼,這個更深的問題正是本階段最後一篇導讀的主題。