為何這些封閉規則要緊
到目前為止,卜瓦松過程已從三個角度為你熟悉:作為具有獨立平穩增量的計數過程、作為許多稀有獨立機會的極限,以及作為一串其間隔時間為獨立指數等待的串流。本篇談的是另一回事——不是「一個」卜瓦松過程「是」什麼,而是當你把它們合併、過濾,或往裡頭窺看時,卜瓦松過程如何「表現」。令人驚奇的事實是:這個家族幾乎堅不可摧——你想對一串事件做的那些自然操作,總是把你帶回卜瓦松家族裡。
三條封閉規則扛起重任,它們是本篇的核心。疊加:把數個獨立的卜瓦松串流合併,合併後的串流仍是卜瓦松,速率單純相加。稀釋:以某機率獨立地保留卜瓦松串流的每一個點,被保留的點再次構成一個卜瓦松過程,速率較小。以及均勻(次序統計量)性質:在「已知某區間內恰好落了多少個點」的條件下,那些點散佈得就像你擲出了那麼多支獨立的均勻飛鏢。每一條規則都把一個困難的機率問題化為簡單的問題,這正是為何卜瓦松過程是抵達、缺陷、來電、光子,以及各種稀有事件的主力模型。
疊加:把串流倒在一起
想像一個有兩條獨立線路的客服中心。銷售來電以速率 lambda_1 = 3 通/小時的卜瓦松過程抵達;客訴來電則獨立地以速率 lambda_2 = 5 通/小時的卜瓦松過程抵達。現在忽略標籤,只盯著「全部」來電的總流量。疊加說的是:合併後的串流本身就是一個卜瓦松過程,且其速率為和:lambda = lambda_1 + lambda_2 = 8 通/小時。在合流處沒有任何怪事發生;合併後的抵達與任一支流一樣乾淨、一樣無記憶。
為何冒出來的是速率之和,而不是更雜亂的東西?採用增量視角。在任何一段區間上,兩條串流貢獻獨立的卜瓦松計數——例如在長度為 t 的窗口上 N_1 ~ Poisson(lambda_1 t) 與 N_2 ~ Poisson(lambda_2 t)。關於卜瓦松分配有一個根基性事實:獨立的卜瓦松相加仍是卜瓦松:N_1 + N_2 ~ Poisson((lambda_1 + lambda_2) t)。因此合併串流的增量是速率為和的卜瓦松,而由於兩個原串流在互不重疊區間上都有獨立增量,合併者亦然。這就是完整的證明——疊加正是「獨立卜瓦松相加」在時間過程上的面貌。
對於任何一個合併後的抵達,還有一個漂亮的附贈:它是從哪條串流來的?「下一通是銷售來電」的機率,恰是它在總速率中的份額,lambda_1 / (lambda_1 + lambda_2) = 3/8。這源自你在間隔時間那裡見過的「競爭指數」圖像——獨立指數等待的最小值是速率為和的指數,而某一個是贏家的機率是它的速率除以總速率。所以疊加不只乾淨地合併了時序,還按速率比例為每個事件分配了歸屬。
稀釋:保留一個隨機子集
稀釋是疊加的逆操作。從一條卜瓦松串流出發,對每一個抵達獨立地擲一枚偏差硬幣:以機率 p 保留此點,以機率 1 - p 丟棄。稀釋說的是:被保留的點構成一個速率為 p*lambda 的卜瓦松過程,被丟棄的點構成一個速率為 (1 - p)*lambda 的卜瓦松過程——而令人驚訝的部分是,這兩條產生出的串流彼此「獨立」。一條每小時 8 通的串流,若每通以機率 p = 0.25 真正緊急,便給出速率為 0.25 * 8 = 2 通/小時的緊急來電卜瓦松過程。
為何又是卜瓦松,而且恰好是速率 p*lambda?以窗口內共有 N ~ Poisson(lambda t) 個點為條件。每個點以機率 p 獨立保留,所以在給定 N 之下,被保留的數目是 Binomial(N, p)。把二項分配對一個卜瓦松計數做混合,是一個經典計算,答案乾淨俐落:被保留數的邊緣分配是 Poisson(p*lambda*t),被丟棄數是 Poisson((1 - p)*lambda*t),且兩者獨立。這個「獨立」才是真正出人意表的一句,且為卜瓦松所獨有;對大多數起始分配而言,保留與丟棄的計數會糾纏在一起。
Thinning a Poisson(lambda) stream by keeping each point with prob p:
kept points ~ Poisson process, rate p * lambda
discarded points ~ Poisson process, rate (1 - p) * lambda
AND the kept and discarded streams are INDEPENDENT.
Superposition is the reverse:
Poisson(rate p*lambda) + Poisson(rate (1-p)*lambda)
--(merge independent)--> Poisson(rate lambda)稀釋之所以極其有用,正是因為它把各部分解耦。若 30% 的網站訪客來自行動裝置,而抵達是速率 lambda 的卜瓦松,那麼行動造訪與桌面造訪就是兩個獨立的卜瓦松過程——你可以分開地建模、排隊、預測它們,從不必擔心忙碌的行動時段抽乾了桌面串流。同一招把保險理賠按類別分類、把光子按偵測器分類、把粒子按散射方向分類,每一類都承襲了自己一條乾淨的卜瓦松過程。
均勻性質:點落在何處
現在以計數為條件。假設你被告知,在區間 [0, T] 內恰好發生了一個卜瓦松抵達。它在這區間的何處發生?答案是再乾淨不過的:它在 [0, T] 上均勻分配。沒有哪一段區間被偏好——已知過去一小時來了一班公車,它在任何一分鐘都同樣可能。沒有「公車會聚在尾端」或「事情會晚一點才平息」這回事;在計數的條件下,那個位置除了「落在窗口內某處」之外,不攜帶任何關於時序的訊息。
完整的陳述是次序統計量性質:在「恰有 n 個抵達落在 [0, T]」的條件下,它們未排序的位置,其分配恰如 n 個獨立的 Uniform(0, T) 點,而實際的抵達時刻就是這些點的次序統計量——同樣那 n 個均勻點,單純地由小到大排好序。所以要模擬一個卜瓦松過程在固定窗口內的時刻,你不需要一步步走過它:先抽 N ~ Poisson(lambda*T),再在 [0, T] 上擲 N 支獨立的均勻飛鏢,然後排序。這條均勻條件性質把動態的過程化為靜態的灑點。
看看這性質在一道迷你題上如何發揮價值。假設某店在一小時的窗口內來了 4 位顧客,以卜瓦松建模。四位都在前半小時抵達的機率是多少?在「計數為 4」的條件下,每位抵達都獨立地在這一小時上均勻分布,所以每位落在前半小時的機率為 1/2。由獨立性,四位全落在前半的機率是 (1/2)^4 = 1/16。我們算出了一個關於時序的真實機率,卻完全沒碰 lambda——一旦以計數為條件,速率便消去了,這正是均勻性質的實用標誌。
彎折速率與跳幅:非齊次與複合
真實的抵達很少整天維持單一固定速率——餐廳在午餐時段坐滿、網站在傍晚達到尖峰。非齊次卜瓦松過程保留獨立增量,卻讓速率隨時間變化,lambda(t)。某區間的計數此時是平均值等於「該區間上速率積分」的卜瓦松:[a, b] 上的平均,是 lambda(t) 從 a 到 b 的曲線下面積,寫成 lambda(t) dt 的積分。其餘一切都存活下來——疊加與稀釋依然成立——而均勻性質也漂亮地推廣了:給定窗口內有 n 個點,它們彼此獨立,但按 lambda(t) 的形狀分布(速率高處較密集),而非平坦的均勻。
這裡有一個與稀釋的美妙連結。一個非齊次卜瓦松過程可以這樣生成:先取一個以「尖峰速率」為常數速率的過程,再用一個隨位置而變、勾勒出所欲形狀的保留機率去稀釋它——這就是著名的稀釋模擬演算法。所以「彎折速率」與「隨機丟點」這兩個想法,是同一套機器的兩種視角,這也是為何速率是統御整幅圖像的那唯一一個旋鈕。
另一個推廣改變的不是事件「何時」發生,而是每個事件「攜帶多少」。在複合卜瓦松過程中,每個卜瓦松抵達都附帶一個獨立的隨機大小——保險抵達上的理賠金額、一筆銷售的金額、每個抵達團體的人數。到時刻 t 累積的總量是 S_t = X_1 + X_2 + ... + X_{N_t},這是一個有 N_t 個獨立跳幅的隨機和,而 N_t 本身是卜瓦松。由隨機和公式(全期望與全變異數定律),其平均為 E[S_t] = lambda*t * E[X],變異數為 Var(S_t) = lambda*t * E[X^2]。事件「個數」仍是卜瓦松,但累計「總額」不再是整數值、也不再是卜瓦松——它從跳幅分配承襲了更豐富的形狀。
魔法止步之處
這些規則威力強大,所以值得精確說明它們的邊界。它們每一條都立基於與卜瓦松過程本身相同的兩根支柱:獨立性與正確的增量結構。疊加需要被合併的串流彼此獨立;稀釋需要每個點的保留或丟棄都獨立於其他點、也獨立於底層過程;而均勻性質是一個條件陳述,它之所以成立,是因為在給定計數之下,那些點確實不再攜帶進一步的結構。移除其中任何一項,你便離開了卜瓦松家族——那些結論不是「近似為真」,而是直接為假。
兩個誠實的迷思要埋葬。第一,封閉規則並沒有說抵達會「避免」聚集——恰恰相反。因為增量獨立且無記憶,卜瓦松抵達確實會憑機運成簇;一段安靜的時段不會讓下一個抵達變得較不可能,這正是賭徒謬誤施加於時間上的無記憶風味。均勻性質甚至把這量化了:在區間上獨立的均勻飛鏢經常落成肉眼可見的簇,所以看似的聚集是「真隨機」的標誌,而非反證。第二,稀釋中「保留串流與丟棄串流彼此獨立」是卜瓦松所獨有的;不要僅因為你把任意一個抵達過程分了兩類,就假定那兩個子類別獨立。
握有疊加、稀釋與均勻性質,你便能近乎代數地操弄卜瓦松串流——把速率相加、按機率拆分、凍住計數以揭露隱藏的均勻性。下一篇把這一切從時間線提起、放上平面:空間卜瓦松點過程及其帶標記的表親,在那裡,同樣這幾條封閉規則統御著天上的星辰、森林裡的樹木,以及矽晶圓上的缺陷。