疊加、稀釋與均勻性質

為何這些封閉規則要緊

到目前為止，卜瓦松過程已從三個角度為你熟悉：作為具有獨立平穩增量的計數過程、作為許多稀有獨立機會的極限，以及作為一串其間隔時間為獨立指數等待的串流。本篇談的是另一回事——不是「一個」卜瓦松過程「是」什麼，而是當你把它們合併、過濾，或往裡頭窺看時，卜瓦松過程如何「表現」。令人驚奇的事實是：這個家族幾乎堅不可摧——你想對一串事件做的那些自然操作，總是把你帶回卜瓦松家族裡。

三條封閉規則扛起重任，它們是本篇的核心。疊加：把數個獨立的卜瓦松串流合併，合併後的串流仍是卜瓦松，速率單純相加。稀釋：以某機率獨立地保留卜瓦松串流的每一個點，被保留的點再次構成一個卜瓦松過程，速率較小。以及均勻（次序統計量）性質：在「已知某區間內恰好落了多少個點」的條件下，那些點散佈得就像你擲出了那麼多支獨立的均勻飛鏢。每一條規則都把一個困難的機率問題化為簡單的問題，這正是為何卜瓦松過程是抵達、缺陷、來電、光子，以及各種稀有事件的主力模型。

疊加：把串流倒在一起

想像一個有兩條獨立線路的客服中心。銷售來電以速率 lambda_1 = 3 通／小時的卜瓦松過程抵達；客訴來電則獨立地以速率 lambda_2 = 5 通／小時的卜瓦松過程抵達。現在忽略標籤，只盯著「全部」來電的總流量。疊加說的是：合併後的串流本身就是一個卜瓦松過程，且其速率為和：lambda = lambda_1 + lambda_2 = 8 通／小時。在合流處沒有任何怪事發生；合併後的抵達與任一支流一樣乾淨、一樣無記憶。

為何冒出來的是速率之和，而不是更雜亂的東西？採用增量視角。在任何一段區間上，兩條串流貢獻獨立的卜瓦松計數——例如在長度為 t 的窗口上 N_1 ~ Poisson(lambda_1 t) 與 N_2 ~ Poisson(lambda_2 t)。關於卜瓦松分配有一個根基性事實：獨立的卜瓦松相加仍是卜瓦松：N_1 + N_2 ~ Poisson((lambda_1 + lambda_2) t)。因此合併串流的增量是速率為和的卜瓦松，而由於兩個原串流在互不重疊區間上都有獨立增量，合併者亦然。這就是完整的證明——疊加正是「獨立卜瓦松相加」在時間過程上的面貌。

對於任何一個合併後的抵達，還有一個漂亮的附贈：它是從哪條串流來的？「下一通是銷售來電」的機率，恰是它在總速率中的份額，lambda_1 / (lambda_1 + lambda_2) = 3/8。這源自你在間隔時間那裡見過的「競爭指數」圖像——獨立指數等待的最小值是速率為和的指數，而某一個是贏家的機率是它的速率除以總速率。所以疊加不只乾淨地合併了時序，還按速率比例為每個事件分配了歸屬。

稀釋：保留一個隨機子集

稀釋是疊加的逆操作。從一條卜瓦松串流出發，對每一個抵達獨立地擲一枚偏差硬幣：以機率 p 保留此點，以機率 1 - p 丟棄。稀釋說的是：被保留的點構成一個速率為 p*lambda 的卜瓦松過程，被丟棄的點構成一個速率為 (1 - p)*lambda 的卜瓦松過程——而令人驚訝的部分是，這兩條產生出的串流彼此「獨立」。一條每小時 8 通的串流，若每通以機率 p = 0.25 真正緊急，便給出速率為 0.25 * 8 = 2 通／小時的緊急來電卜瓦松過程。

為何又是卜瓦松，而且恰好是速率 p*lambda？以窗口內共有 N ~ Poisson(lambda t) 個點為條件。每個點以機率 p 獨立保留，所以在給定 N 之下，被保留的數目是 Binomial(N, p)。把二項分配對一個卜瓦松計數做混合，是一個經典計算，答案乾淨俐落：被保留數的邊緣分配是 Poisson(p*lambda*t)，被丟棄數是 Poisson((1 - p)*lambda*t)，且兩者獨立。這個「獨立」才是真正出人意表的一句，且為卜瓦松所獨有；對大多數起始分配而言，保留與丟棄的計數會糾纏在一起。

Thinning a Poisson(lambda) stream by keeping each point with prob p:

  kept points      ~ Poisson process, rate p * lambda
  discarded points ~ Poisson process, rate (1 - p) * lambda
  AND the kept and discarded streams are INDEPENDENT.

Superposition is the reverse:

  Poisson(rate p*lambda)  +  Poisson(rate (1-p)*lambda)
      --(merge independent)-->  Poisson(rate lambda)

稀釋把一條卜瓦松串流拆成獨立的子串流；疊加把獨立串流重新合併。它們互為逆操作。

稀釋之所以極其有用，正是因為它把各部分解耦。若 30% 的網站訪客來自行動裝置，而抵達是速率 lambda 的卜瓦松，那麼行動造訪與桌面造訪就是兩個獨立的卜瓦松過程——你可以分開地建模、排隊、預測它們，從不必擔心忙碌的行動時段抽乾了桌面串流。同一招把保險理賠按類別分類、把光子按偵測器分類、把粒子按散射方向分類，每一類都承襲了自己一條乾淨的卜瓦松過程。

均勻性質：點落在何處

現在以計數為條件。假設你被告知，在區間 [0, T] 內恰好發生了一個卜瓦松抵達。它在這區間的何處發生？答案是再乾淨不過的：它在 [0, T] 上均勻分配。沒有哪一段區間被偏好——已知過去一小時來了一班公車，它在任何一分鐘都同樣可能。沒有「公車會聚在尾端」或「事情會晚一點才平息」這回事；在計數的條件下，那個位置除了「落在窗口內某處」之外，不攜帶任何關於時序的訊息。

完整的陳述是次序統計量性質：在「恰有 n 個抵達落在 [0, T]」的條件下，它們未排序的位置，其分配恰如 n 個獨立的 Uniform(0, T) 點，而實際的抵達時刻就是這些點的次序統計量——同樣那 n 個均勻點，單純地由小到大排好序。所以要模擬一個卜瓦松過程在固定窗口內的時刻，你不需要一步步走過它：先抽 N ~ Poisson(lambda*T)，再在 [0, T] 上擲 N 支獨立的均勻飛鏢，然後排序。這條均勻條件性質把動態的過程化為靜態的灑點。

看看這性質在一道迷你題上如何發揮價值。假設某店在一小時的窗口內來了 4 位顧客，以卜瓦松建模。四位都在前半小時抵達的機率是多少？在「計數為 4」的條件下，每位抵達都獨立地在這一小時上均勻分布，所以每位落在前半小時的機率為 1/2。由獨立性，四位全落在前半的機率是 (1/2)^4 = 1/16。我們算出了一個關於時序的真實機率，卻完全沒碰 lambda——一旦以計數為條件，速率便消去了，這正是均勻性質的實用標誌。

彎折速率與跳幅：非齊次與複合

真實的抵達很少整天維持單一固定速率——餐廳在午餐時段坐滿、網站在傍晚達到尖峰。非齊次卜瓦松過程保留獨立增量，卻讓速率隨時間變化，lambda(t)。某區間的計數此時是平均值等於「該區間上速率積分」的卜瓦松：[a, b] 上的平均，是 lambda(t) 從 a 到 b 的曲線下面積，寫成 lambda(t) dt 的積分。其餘一切都存活下來——疊加與稀釋依然成立——而均勻性質也漂亮地推廣了：給定窗口內有 n 個點，它們彼此獨立，但按 lambda(t) 的形狀分布（速率高處較密集），而非平坦的均勻。

這裡有一個與稀釋的美妙連結。一個非齊次卜瓦松過程可以這樣生成：先取一個以「尖峰速率」為常數速率的過程，再用一個隨位置而變、勾勒出所欲形狀的保留機率去稀釋它——這就是著名的稀釋模擬演算法。所以「彎折速率」與「隨機丟點」這兩個想法，是同一套機器的兩種視角，這也是為何速率是統御整幅圖像的那唯一一個旋鈕。

另一個推廣改變的不是事件「何時」發生，而是每個事件「攜帶多少」。在複合卜瓦松過程中，每個卜瓦松抵達都附帶一個獨立的隨機大小——保險抵達上的理賠金額、一筆銷售的金額、每個抵達團體的人數。到時刻 t 累積的總量是 S_t = X_1 + X_2 + ... + X_{N_t}，這是一個有 N_t 個獨立跳幅的隨機和，而 N_t 本身是卜瓦松。由隨機和公式（全期望與全變異數定律），其平均為 E[S_t] = lambda*t * E[X]，變異數為 Var(S_t) = lambda*t * E[X^2]。事件「個數」仍是卜瓦松，但累計「總額」不再是整數值、也不再是卜瓦松——它從跳幅分配承襲了更豐富的形狀。

魔法止步之處

這些規則威力強大，所以值得精確說明它們的邊界。它們每一條都立基於與卜瓦松過程本身相同的兩根支柱：獨立性與正確的增量結構。疊加需要被合併的串流彼此獨立；稀釋需要每個點的保留或丟棄都獨立於其他點、也獨立於底層過程；而均勻性質是一個條件陳述，它之所以成立，是因為在給定計數之下，那些點確實不再攜帶進一步的結構。移除其中任何一項，你便離開了卜瓦松家族——那些結論不是「近似為真」，而是直接為假。

兩個誠實的迷思要埋葬。第一，封閉規則並沒有說抵達會「避免」聚集——恰恰相反。因為增量獨立且無記憶，卜瓦松抵達確實會憑機運成簇；一段安靜的時段不會讓下一個抵達變得較不可能，這正是賭徒謬誤施加於時間上的無記憶風味。均勻性質甚至把這量化了：在區間上獨立的均勻飛鏢經常落成肉眼可見的簇，所以看似的聚集是「真隨機」的標誌，而非反證。第二，稀釋中「保留串流與丟棄串流彼此獨立」是卜瓦松所獨有的；不要僅因為你把任意一個抵達過程分了兩類，就假定那兩個子類別獨立。

握有疊加、稀釋與均勻性質，你便能近乎代數地操弄卜瓦松串流——把速率相加、按機率拆分、凍住計數以揭露隱藏的均勻性。下一篇把這一切從時間線提起、放上平面：空間卜瓦松點過程及其帶標記的表親，在那裡，同樣這幾條封閉規則統御著天上的星辰、森林裡的樹木，以及矽晶圓上的缺陷。