JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

唯一性:當一個變換鎖定一個分配

本單元所有的變換技巧都倚靠一個安靜的承諾:若兩個隨機變數共用同一個變換,它們就共用同一個分配。本篇把這個承諾講精確、說清楚它何時成立,並把它變成一台證明的引擎。

每個變換技巧背後那個安靜的承諾

退一步,看看你整個單元一直在做什麼。你把一堆獨立變數的和拿來,把它們的變換相乘,認出這個乘積是某個已知的變換,然後宣告:「所以這個和就是那個分配。」最後這一步才是整個遊戲的核心,而它悄悄地假設了一件很深的事:認出變換,就等於認出分配。像動差生成函數特徵函數這樣的變換,會把一整個分配壓縮成關於一個啞變數的一個整潔函數。唯一性定理就是那個保證:壓縮過程中沒有任何資訊遺失——你永遠可以把它解壓縮,還原成恰好一個分配。

為什麼這不是顯而易見的?變換是單一個函數,分配也是單一個對象,但兩者之間的對應是否一對一,遠遠不清楚。許多自然的摘要都不是一對一的:兩個截然不同的分配可以共用同一個平均值,甚至共用同樣的平均值與變異數,或者——一如你兩篇前所見——共用一模一樣的前十個動差卻仍然不同。所以若知道一把動差都鎖不住一個分配,為什麼知道一個變換就能?答案是:變換並不是一把數字,它是一整個函數,是不可數無限多個值,而事實證明,這恰好足以完整地還原那個分配。

為什麼一整個函數就夠,而幾個動差不夠

先把離散的情形握在手裡,因為那裡的魔法是透明的。一個非負整數變數的機率生成函數是 G(s) = E[s^X] = P(X=0) + P(X=1) s + P(X=2) s^2 + ...。這不過是一個普通的冪級數,而它的係數「就是」機率本身。兩個作為函數相等的冪級數,必定逐項有相同的係數——這正是多項式與冪級數的剛性。所以若兩個計數變數有相同的機率生成函數,則對每一個 k 都有 P(X=k) = P(Y=k),它們就是同一個分配。這裡的唯一性不是奇蹟;它只是在說:冪級數會記住自己的每一個係數。

連續的情形在精神上是一樣的,只是把求和換成積分。傅立葉反演公式明確地做出那個解壓縮:給定特徵函數 phi(t) = E[e^(itX)],你可以把 phi(t) e^(-itx) 對所有 t 積分再除以 2 pi,從而重建出密度(當密度存在時)。你永遠不需要真的親手去算這個積分——重點在於它存在。它說:從分配到變換的這道食譜是可逆的,所以這個對應是一對一的,所以變換是一個忠實的指紋。這直接連回階梯更早處的一個主題:分配就是隨機變數的完整描述,而變換不過就是同一份完整描述,用另一套字母寫下來而已。

動差生成函數版本及其附帶細則

最乾淨的實用陳述是動差生成函數唯一性定理:若兩個隨機變數的動差生成函數在某個包含零的開區間上相等且有限,則它們有相同的分配。「在包含零的開區間上」這句話是承重的細則。動差生成函數只在幾個零散的點上相符是不夠的,只在零點相符也是不夠的(每個動差生成函數在 t = 0 都等於 1,這什麼都告訴不了你)。你需要一整個小鄰域內都相符;正是那個鄰域編碼了所有動差,從而編碼了整個函數。

但這個定理有一個你必須尊重的真實前提:動差生成函數首先得在零點附近存在,而對某些再尋常不過的分配,它並不存在。對數常態分配的所有動差都有限,然而它的動差生成函數對每一個正的 t 都是無限大,所以根本沒有動差生成函數可以拿來套用這個定理。更糟的是,對數常態正是「不被自己的動差所決定」的教科書範例——存在一整族彼此不同的分配,共用對數常態的每一個動差。這是最尖銳的警告:當動差生成函數存在時,它遠強於一張動差清單;而動差生成函數的缺席是一道貨真價實的牆,不是形式上的客套。

正是在這一刻,上一篇的功夫得到回報。特徵函數帶著一個更強的唯一性定理——特徵函數唯一地決定分配,沒有但書——而且它不附帶任何前提,因為任何隨機變數的特徵函數永遠存在(它是 e^(itX) 的期望值,其模長被 1 所界,所以積分絕不會發散)。所以那個擊敗了動差生成函數的對數常態,仍然被它的特徵函數唯一地鎖定。你伸手去拿的那個變換可能失效;但底層的唯一性,只要陳述正確,從不失效。

把唯一性當成一台證明引擎

現在來看實務上的回報。唯一性把每一個變換之間的等式,轉換成分配之間的等式,而這正是變換法真正用來證明事情的方式。每當你算出一個變換並認出答案,你就獲准直接讀出分配——不必對密度積分、不必卷積、不必巧妙地換元。模式永遠是同樣的三拍:(1) 寫下你關心對象的變換,(2) 用「和變成積」或已知形式去化簡,(3) 把化簡後的變換對上型錄裡的一條,援引唯一性來為這個分配命名。

  1. 要證明的主張:兩個獨立常態的和仍是常態。設 X ~ Normal(mu1, sigma1^2) 與 Y ~ Normal(mu2, sigma2^2) 獨立,考慮 S = X + Y。
  2. 套用本單元前面的「和變成積」規則:獨立和的動差生成函數是各自的乘積,所以 M_S(t) = M_X(t) * M_Y(t)。
  3. 代入已知的常態動差生成函數 M(t) = exp(mu t + sigma^2 t^2 / 2),相乘。把指數相加得到 exp((mu1+mu2) t + (sigma1^2+sigma2^2) t^2 / 2)。
  4. 認出這個結果:它恰好是 Normal(mu1+mu2, sigma1^2+sigma2^2) 的動差生成函數。由動差生成函數唯一性定理,S 必定「就是」那個分配。完成——全程沒算過任何密度積分。

這個論證正是獨立常態相加仍為常態背後的引擎;而同一台機器,把動差生成函數換成特徵函數來跑,正是中央極限定理的變換證明之所以可能的原因:你證明標準化後的和之特徵函數收斂到 e^(-t^2/2),然後唯一性的極限版本讓你下結論說分配收斂到標準常態。唯一性就是那個鉸鏈,讓整個學科從「這些函數相符」轉到「這些分配相同」。

誠實地解讀這個指紋

把正確的圖像固定下來會有幫助:變換是分配的一個指紋。在指紋有定義的每一處都相符,你就抓到了那個唯一的嫌犯;但你必須對「每一處」是什麼意思、以及你用了哪一種指紋格外小心。有幾個陷阱會絆倒初學者。只在 t = 0 處讓動差生成函數相符,什麼也證不了,因為所有動差生成函數在那裡都一致。在一些孤立散點上相符也什麼都證不了,因為兩個不同的解析函數可以在點上交會。而在一段區間上讓動差生成函數相符,只有在兩個動差生成函數確實都在該區間上存在時才有效——否則你是在拿一個指紋跟一張空白比對。

還有兩個誠實的提醒值得帶著走。第一,唯一性說的是分配,不是變數本身:兩個有相同變換的隨機變數是同分配的,這並不代表它們作為樣本空間上的函數相等,也不代表它們以某種特定方式獨立或相依——只代表它們的分配一致。第二,不要過度解讀動差。即使動差生成函數存在且唯一地決定一個分配,那個決定也是寄存在整個函數裡的;從一份被截斷的動差清單去重建分配,是另一個而且往往是不適定的問題,這正是為什麼對數常態可以被冒牌貨在動差上「攣生」,而它的特徵函數卻仍然說著真話。

把整個單元串起來。動差生成函數與機率生成函數是親切的、計算型的變換:對動差好微分,對和好相乘,而且只要它們舒舒服服地存在就具唯一性。特徵函數是嚴謹的後盾:永遠都在、永遠唯一,是在柯西分配與對數常態這種動差生成函數舉手投降之處仍然管用的工具。唯一性是那一個讓它們全都物有所值的定理——它正是為什麼「我認出了這個變換」可以成為「這是什麼分配?」這個問題的一個完整而嚴謹的答案。