把過程側過來看:從計數到空隙
本階第 1 篇用三種等價方式建構了卜瓦松過程,其中之一是計數觀點:N(t) 是到時刻 t 為止的事件數,它具有獨立增量,而在任一長度為 s 的時窗上,計數服從均值為 lambda·s 的卜瓦松分配,其中 lambda 是發生率。那種描述盯著*縱*軸——計數的階梯爬得多高。本篇把這幅圖側過來,改盯*橫*軸:不問已經發生了幾件事,而問兩件事之間我們要等多久。
想像一個清閒的客服台,電話隨機進來。把每通電話標成時間軸上的一個點。第一通在時刻 T_1 落下;第二通在 T_2;依此類推。我們在意的數字是相鄰兩點之間的*空隙*:X_1 = T_1(從零時刻到第一通的等待)、X_2 = T_2 - T_1、X_3 = T_3 - T_2,一般地 X_n = T_n - T_{n-1}。這些空隙就是到達間隔時間,它們本身就是隨機變數。本篇的主張——也就是頭條結論——是:對卜瓦松過程而言,每一段到達間隔時間都服從同一個發生率 lambda 的指數分配,而且這些空隙彼此獨立。
為什麼第一段空隙是指數的
先看到第一件事為止的等待 X_1。訣竅不是直接求它的密度,而是求它的存活機率 P(X_1 > t):你在時刻 t 仍在等待的機率。但「在時刻 t 仍在等待」用計數語言說只意味一件事——*在 [0, t] 內零件事發生*。我們已經知道這個計數服從均值 lambda·t 的卜瓦松分配,而一個卜瓦松變數等於 0 的機率是 e^(-lambda·t)。所以 P(X_1 > t) = e^(-lambda·t)。用 1 去減便得累積分布函數 F(t) = 1 - e^(-lambda·t),再求導便得密度 f(t) = lambda·e^(-lambda·t)(t >= 0)。這恰恰就是發生率為 lambda 的指數分配。
P(X_1 > t) = P(no events in [0, t])
= P(N(t) = 0)
= e^(-lambda*t) (Poisson, mean lambda*t, at 0)
=> F(t) = 1 - e^(-lambda*t) (the cdf)
=> f(t) = lambda * e^(-lambda*t) (the density, t >= 0)
E[X_1] = 1 / lambda (mean gap)
Var(X_1) = 1 / lambda^2均值空隙 E[X_1] = 1/lambda 是個值得停下來檢驗的合理性測試。若電話以 lambda = 3 通/小時進來,兩通之間的平均等待是 1/3 小時,也就是 20 分鐘——正是把一小時分給三通電話所猜到的數。也請注意,這裡的離散程度恰等於均值:標準差同樣是 1/lambda,因為 Var = 1/lambda^2。指數型的等待出奇地多變;許多短空隙之間,偶爾穿插一段很長的,這正是「時間上的真隨機」的視覺特徵。
無記憶性:會遺忘的等待
指數分配帶有一個 [0, 無窮) 上沒有其他連續分配具備的性質:它是無記憶的。用符號寫:對所有 s, t >= 0,P(X > s + t given X > s) = P(X > t)。把它讀出來:在「你已經等了 s 分鐘卻什麼都沒發生」的條件下,你還要再等至少 t 分鐘的機率,和你剛走過來時一模一樣。這座時鐘不會「暖機」。代入存活函數一驗,它立刻掉出來:P(X > s + t and X > s) / P(X > s) = e^(-lambda(s+t)) / e^(-lambda·s) = e^(-lambda·t),正是 P(X > t)。
這是你在離散分配那裡早已遇過的一個事實的連續時間孿生兄弟:幾何分配是正整數上唯一無記憶的分配,而它的無記憶性說的是:過去的失敗並不會讓下一次成功變得更「該來」。事實上,若你把卜瓦松過程想成許多極微小的擲幣時間格的極限(每格成功機率都很小),則以「格」計的幾何等待,便化為連續時間中的指數等待。無記憶性挺過了這個極限;指數分配不過就是幾何分配的連續影子。
獨立的空隙建起整個過程
無記憶性不只描述了一段空隙——它生成了整個過程。論證鏈如下。一旦第一件事在 T_1 發生,依獨立增量,卜瓦松過程在 T_1 之後的增量是一個對過去一無所知的全新卜瓦松過程。於是到*下一*件事為止的等待 X_2 又是指數(lambda),且與 X_1 獨立。如此反覆:每一段到達間隔時間 X_1, X_2, X_3, ... 都互相獨立,且各自服從同一發生率 lambda 的指數分配。這給出一道乾淨、可建構的配方——可放在第 1 篇那兩種建構法旁邊的第三種卜瓦松過程造法。
- 抽取獨立的等待 X_1, X_2, X_3, ...,每一個都來自指數(lambda)分配——例如用反轉換技巧,X = -(1/lambda)·ln(U),其中 U 是 (0,1) 上的均勻變數。
- 用累積和定出到達時刻:T_1 = X_1、T_2 = X_1 + X_2、T_3 = X_1 + X_2 + X_3,依此類推。
- 把計數 N(t) 定義為這些 T_n 中 <= t 的個數——一道在每次到達時向上跳一階的階梯。
- 你剛建起的 N(t) 可被證明具有獨立增量,且計數服從卜瓦松(lambda·t):它是一個如假包換、純由指數空隙拼出的卜瓦松過程。
這個建構法也是在電腦上*模擬*卜瓦松過程的標準作法,並且它把一個微妙的建模重點說得誠實。空隙獨立且同為指數,是個很強的假設:它表示到達既不群聚(一件事使另一件事不久後更可能發生),也不彼此疏開(每件事後有一段不應期的停頓)。真實的到達常常會出現其中一種,這時資料看起來就不會是指數的,需要更豐富的模型。卜瓦松過程是「毫無結構」的乾淨基準線,而非放諸四海的定律。
把空隙相加:厄朗與伽瑪到達時間
現在問一個稍大的問題:到第 n 件事到達為止要多久?那就是到達時刻 T_n = X_1 + X_2 + ... + X_n,即 n 段獨立指數(lambda)等待之和。獨立事物之和構成一個新分配,而這個特定的分配有個名字:T_n 服從形狀為 n、發生率為 lambda 的厄朗分配。其密度為 f(t) = lambda^n · t^(n-1) · e^(-lambda·t) / (n-1)!(t >= 0)。厄朗分配不過是伽瑪分配族中形狀取整數的成員;容許非整數形狀便得到完整的伽瑪分配,但「等待整數件事」讓我們停留在厄朗分配內。
兩項檢查讓這件事可信。由期望值的線性性,等到 n 件事的均值等待為 E[T_n] = n·E[X_1] = n/lambda——n 段平均長度各為 1/lambda 的空隙,正應如此。而且有一道漂亮的橋通回計數:事件 {T_n <= t},「第 n 次到達已在時刻 t 前發生」,與事件 {N(t) >= n},「到時刻 t 為止至少有 n 件事」,是同一個事件。這個單一恆等式把厄朗分配的累積分布函數連到一串卜瓦松機率之和,正是第一節那本「計數—空隙」字典的實際運用。
一個具體數字把它串起來。在 lambda = 3 通/小時下,等到第 5 通的期望等待是 5/3 小時,約 100 分鐘。單段空隙的均值是 20 分鐘;五段平均起來就是 100 分鐘,而因為空隙獨立,變異數也相加——Var(T_5) = 5/lambda^2。本階接下來每一層都會持續倚賴同一個招式:在計數與空隙之間翻譯,並利用獨立性把東西加起來。