JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

卜瓦松過程:三種等價觀點

卜瓦松過程是連續時間中「純粹隨機到達」的典範模型。令人驚訝的是,三個看來大不相同的定義——一個計數版、一個增量版、一個無窮小版——描述的竟是完全相同的過程。

我們想建模的是什麼

想像服務台陸續接到的來電、打在同一塊地磚上的雨點、蓋革計數器的滴答聲,或顧客踏進店門的時刻。這些事件一個一個地到達,散落在連續時間軸上的隨機瞬間,沒有任何內在時鐘告訴它們何時該來。我們暫時還不在乎每個事件「是什麼」——只在乎它「何時」發生。記錄這件事的物件是一個計數過程 N(t):直到並包含時刻 t 為止已發生的事件數。N(0) = 0,N(t) 只增不減,且每當一個事件落下,它就恰好跳升 1。

現在加上一個讓事情變乾淨的建模假設:到達在時間上*完全沒有結構*。在精確的意義下,每個瞬間對一次到達而言都和其他瞬間一樣好,而某一時間段裡發生的事,對另一段毫無透露。這正是你在我們初次定義隨機過程時遇到的獨立平穩增量觀念在連續時間中的自然近親。恰好建立在這個假設上的計數過程,就是卜瓦松過程,而掌控事件來得多快的那個單一數字,就是強度(速率) lambda,單位是「每單位時間的事件數」。

觀點一——計數定義

第一種觀點直接說明任一區間內落入多少事件。我們稱 N(t) 為速率 lambda 的卜瓦松過程,若以下三件事成立。(i) N(0) = 0——開始計時時尚未計入任何事件。(ii) 過程具有獨立增量:對不相交的時間區間,各自的到達數彼此獨立。(iii) 任何長度為 s 的區間內的到達數服從均值為 lambda·s 的卜瓦松分配;也就是 N(t + s) - N(t) ~ Poisson(lambda·s),只依賴長度 s,而不依賴區間落在何處。

兩個推論立刻浮現。由於 Poisson(lambda·s) 變數的均值是 lambda·s,我們得到 E[N(t)] = lambda·t——平均每單位時間 lambda 個事件,這正是把 lambda 稱作「速率」所應有的意思。又由於卜瓦松變數的變異數等於其均值,於是同樣有 Var(N(t)) = lambda·t:卜瓦松過程的一個指紋,就是計數的變異數等於其均值。「只依賴長度 s、不依賴位置」這一點就是*平穩增量*性質——過程沒有偏好的時鐘時刻。

觀點二——無窮小定義

第二種觀點根本不提卜瓦松分配。它改而描述過程在一個趨近於零、長度為 h 的短窗內的*局部*行為,同樣假設獨立平穩增量。配方如下:在寬度為 h 的微小區間內,恰好一次到達的機率是 lambda·h 加上相對於 h 可忽略的項;兩次或以上到達的機率本身相對於 h 可忽略;於是沒有到達的機率是 1 - lambda·h,同樣容許可忽略的項。簡記為:P(h 內一次到達) ~ lambda·h、P(h 內兩次以上) ~ 0、P(h 內零次) ~ 1 - lambda·h。

關鍵的第三條——雙重到達極其罕見——是有序性的正式陳述:在真正的卜瓦松過程裡,事件絕不重合;它們一次只來一個。這個觀點是物理學家與排隊理論學家偏愛的,因為它讀起來像一條自然律:在每一眨眼的時間裡,系統要麼什麼也不做,要麼登記單一事件,且每瞬間有一個恆定的傾向 lambda。從這些局部速率出發,你可以為 P(N(t) = k) 列出一條微分方程並解之;浮現的解恰好就是觀點一的 Poisson(lambda·t) 律。同一個過程,由下而上推出。

「相對於 h 可忽略」是那句含糊話的誠實版本,而它值得釘清楚,因為這一步太常被略過。精確的說法用小 o 記號:誤差項是 o(h),意思是當 h 趨於 0 時它們比 h 更快地縮小,所以把它們除以 h 會趨於零。這並不是某個機率「真的等於零」——而是一個一旦窗口夠小便變得無關緊要的機率。略去這個但書,正是無窮小觀點常被草率教授的方式。

觀點三——間隔時間定義

第三種觀點不去計數,而是藉由「事件之間要等多久」來建構過程。令 T_1 為到第一次到達的時間、T_2 為第一到第二之間的間隔、T_3 為第二到第三之間的間隔,依此類推;這些就是間隔時間。定義如下:速率 lambda 的卜瓦松過程,就是當 T_1, T_2, T_3, ... 為獨立隨機變數、每個都服從速率 lambda 的指數分配時你所得到的東西。把這些間隔首尾相接,在每個累計和處點一個點——那些點就是到達時刻,而到時刻 t 為止點的個數就是 N(t)。

為什麼偏偏是指數?因為它是*唯一*具備無記憶性的連續等待時間律,而無記憶性正是觀點二的「局部無結構」從等待這一側看過去的樣子:若過去 30 秒沒有事件到來,你剩餘的等待與一段全新的等待同分配——過程不會朝著一個「該來」的到達「累積」。本階下一篇指南就專講這條指數的連結,所以這裡只先點出。也請留意:到第 n 次到達的時間是 n 個獨立指數之和,這給出厄朗(伽瑪)分配——連接「等待」與「計數」的橋梁。

View 1  COUNTING:      N(t+s) - N(t) ~ Poisson(lambda*s),
                        independent over disjoint intervals

View 2  INFINITESIMAL:  P(1 arrival in h) = lambda*h + o(h)
                        P(>=2 in h)       = o(h)
                        P(0 in h)         = 1 - lambda*h + o(h)

View 3  INTERARRIVAL:   T_1, T_2, T_3, ... i.i.d. Exponential(lambda)

         ----  all three define the SAME process  ----
速率 lambda 的卜瓦松過程的三個定義——以及它們彼此重合的定理。

為何要三種觀點,以及一個算例

本篇指南的深刻事實是一條定理:這三個定義在邏輯上等價——任何滿足其一的過程都滿足另外兩個。證明可雙向進行。從間隔時間觀點,你能證明計數服從卜瓦松;從無窮小速率,你能同時推出計數與指數間隔;如此繞圈一周。你現在不必跟完每一步證明;好處是實用的。當問題給你一個計數(「一小時內有幾通電話?」),就動用觀點一。當它給你一段等待(「離下通電話還有多久?」),就動用觀點三。當你必須論證某現象「為何」竟是卜瓦松時,就從觀點二的局部獨立性立論。

用 lambda = 3(每小時)的來電把它具體化。用觀點一,未來兩小時的來電數是 Poisson(3·2) = Poisson(6),所以恰好五通的機率是 P(N = 5) = e^(-6)·6^5 / 5!,約為 0.161。期望通數 E[N] = 6,且作為卜瓦松,Var(N) = 6 亦然。對同一設定用觀點三,下一通電話的等待是 Exponential(3),所以等待超過 20 分鐘(三分之一小時)的機率是 e^(-3·(1/3)) = e^(-1) ~ 0.368。兩個問題、兩種觀點、一個底層過程——而依等價定理,答案彼此相容。

帶著一個誠實的但書往下走。真實的到達流往往*並非*卜瓦松:尖峰時段破壞平穩性、來電以相關的爆發成群到來而破壞獨立性,而兩個事件有時確實重合而破壞有序性。卜瓦松過程是衡量這類結構的乾淨基準,而非放諸四海的真理。後續的指南會依次放鬆每個假設——讓速率隨時間變化、為每個事件附上大小或標記、把點鋪在空間而非一條線上、以及用任意間隔取代指數間隔——所以你剛看到的這份等價,正是那些推廣所立足的根基。