從卜瓦松到更新:放掉指數分配
整整這一級都建立在一個特別的時鐘上。卜瓦松過程計數的是這樣的事件:它們之間的間隔——也就是到達間隔時間——彼此獨立、且服從同一個指數分配,而正是這一個選擇給了我們所有的魔法:獨立增量、無記憶的重啟、乾淨的速率 lambda。但真實世界的到達很少這麼聽話。公車不會無記憶地到站;一顆已經燒了一陣子的燈泡,接下來壞掉的機會通常比一顆全新的更高,而非相等。於是我們問出最自然的下一個問題:如果那些間隔依然獨立同分配、卻不是指數分配,還有什麼會留下來?
這個推廣就是 更新過程(renewal process)。挑任意一個正值到達間隔的分配 F,平均數為 mu = E[X](我們不再要求 X 是指數的)。從 F 獨立地抽出間隔 X_1、X_2、X_3、...。到達時刻就是這些累加和 S_n = X_1 + ... + X_n,而計數 N(t) 不過是「到時刻 t 為止已發生幾次到達」。每一次到達都是一次「更新」:在那一瞬間,過程忘掉一切,為下一段間隔從頭開始計時。見更新過程。卜瓦松過程是其中那個特別的成員——F 恰為指數分配;也唯有此時,無記憶性質才成立。
長程的計數:更新函數與基本更新定理
我們最先想知道的是:到時刻 t 為止,平均該期待多少次更新?這個期望計數就是 更新函數(renewal function),m(t) = E[N(t)]。它比看起來難,因為 N(t) 依賴於一整串隨機間隔的和;但它的長程行為卻美得出奇。見更新函數。最重磅的結果——基本更新定理(elementary renewal theorem)——說:更新的長程速率恰好是平均間隔的倒數:當 t 增大時 m(t)/t -> 1/mu。若公車平均每 10 分鐘來一班,那麼漫長的一天裡你大約會見到 t/10 班。不令人意外——但它對 *任何* 平均數為 mu 的間隔分配都成立,無論是不是指數的。
為什麼速率直覺上是 1/mu?由強大數法則,第 n 次到達時刻 S_n = X_1 + ... + X_n 在 n 大時約如 n·mu 般成長:平均間隔安定到 mu。所以第 n 次更新大約發生在時刻 n·mu,這等同於說:到時刻 t 為止,我們大約經歷了 t/mu 次更新。強大數法則做了粗重活;更新定理只是把它的陳述透過計數過程讀出來。這正是更新世界裡那條你早已在卜瓦松過程見過的『lambda = 1/平均間隔』——如今從指數分配中解放了出來。
把這些物件釘牢,它們其實很整齊。間隔 X_1、X_2、... 獨立同分配於 F,平均數 mu = E[X];到達時刻為 S_n = X_1 + ... + X_n;到時刻 t 的計數為 N(t) = max{ n : S_n <= t };而更新函數為 m(t) = E[N(t)]。基本更新定理便讀作:當 t -> 無窮時 m(t)/t -> 1/mu。在卜瓦松特例中,F 為 Exponential(lambda),故 mu = 1/lambda,定理給出 1/mu = lambda——正是你整級用到的那個速率。一個有用的親戚是 更新報酬定理(renewal-reward theorem):若每次更新帶來一份報酬,你的長程單位時間報酬為 E[報酬]/mu,即同一個 1/mu 的節奏再乘上平均報酬。
那班總是誤點的公車:檢驗悖論
現在來到那個著名的轉折。公車以更新過程到站,平均間隔 mu = 10 分鐘。你在一個隨機的時刻出現,一無所知,等下一班車。常識悄聲說:你落在一段「典型」的間隔裡,所以你的等待平均該約 5 分鐘——10 的一半。常識錯了。你恰好落入的那段間隔,系統性地比平均間隔 *更長*,於是你等的時間也超過 mu 的一半。這就是 檢驗悖論(inspection paradox)。見檢驗悖論。
畫個圖立刻就懂。把所有間隔當作一段段區間排在時間軸上。長間隔在時間軸上覆蓋的範圍比短間隔多——一段 20 分鐘的間隔佔的路,是一段 10 分鐘間隔的兩倍。所以當你在一個隨機瞬間落下,你 *更容易* 落進一段長間隔裡,純粹因為長間隔是更大的標靶。這是對間隔做了「長度偏倚」的抽樣:每段間隔實際上被它自己的長度加權了。短間隔被抽得不足,長間隔被抽得過多,而你親身經歷的那段間隔便相應地被拉長。同一個效應,讓學生體感的平均班級人數,比教務處公布的平均班級人數來得大。
ordinary gap mean: E[X] = mu length-biased gap mean: E[X^2]/mu = mu + Var(X)/mu >= mu ( equality only when Var(X) = 0, i.e. every gap is exactly mu ) your expected wait for the next event = ( E[X^2] / mu ) / 2 (Poisson case below)
連卜瓦松過程也躲不掉
接下來這一段,真的會讓人吃驚。無記憶的卜瓦松過程總該躲過這個悖論吧?並沒有——而它「躲過」的方式本身就是笑點所在。假設公車是速率 lambda = 1(每 10 分鐘一班)的卜瓦松過程,所以 mu = 10、間隔服從指數分配。由無記憶性,當你抵達時,你等待 *下一班* 車的期望竟是完整的 10 分鐘,而非 5 分鐘:指數分配忘掉了那班已經開走的車,所以你向前的等待看起來像一段全新、完整的間隔。光是這一點就夠驚人了——你的等待等於整個平均間隔,而非它的一半。
現在看看你實際落入的那段間隔:它是你向前的等待,*加上* 距上一班車的時間(你身後的「年齡」)。由無記憶性,向後的年齡同樣是平均數 10 的指數分配,且與向前等待獨立。所以你落入的整段間隔,期望長度是 10 + 10 = 20 分鐘——足足是普通平均數 10 的兩倍!指數分配自身的變異數(這裡 Var(X) = mu^2)直接餵進長度偏倚公式 E[X^2]/mu = 2·mu。卜瓦松過程並沒有閃過檢驗悖論;它展現的是這個悖論最乾淨利落的版本。
- 先弄清你在抽樣什麼。當你挑一個隨機的 *時間* 點而非一段隨機的間隔時,檢驗悖論就會發作——時間抽樣會以長度加權每段間隔。
- 對你真正會經歷的那段間隔,計算長度偏倚平均數 E[X^2]/mu,而非普通平均數 mu。
- 把那段被觀測到的間隔拆成「向前等待 + 向後年齡」;對卜瓦松過程,由無記憶性,每一塊都是平均數 mu 的指數分配。
- 讀出寓意:你的期望等待是 (E[X^2]/mu)/2,在卜瓦松情形下等於 mu——絕非天真以為的 mu/2。
這為何重要,以及不該下的結論
更新理論是許多領域背後沉默的主力:可靠度工程(反覆更換的零件何時故障?)、排隊論與 M/M/1 佇列、存貨補貨,以及任何「重設後再跑」的系統。基本更新定理告訴你長程速率;更精細的結果如關鍵更新定理,則刻畫穩態下的「年齡」與「剩餘壽命」。而檢驗悖論並非趣聞——它是真實量測中反覆出現的陷阱:使用者體感的平均下載速度、來電者體感的平均等待、乘客體感的平均擁擠程度,全都偏向更糟,因為「體驗」本身被長度偏倚了。
兩點誠實的提醒。其一,這個悖論在邏輯意義上 *並非* 悖論,沒有任何東西出錯——它只反映出兩種不同的抽樣方式(挑一段間隔 vs. 挑一個時間點)給出兩個不同、卻都正確的平均數。公車公司的「平均 10 分鐘」對間隔為真;你的「20 分鐘間隔」對時間點為真。兩者都沒說謊。其二,別把它跟賭徒謬誤或一廂情願的「終會扯平」混為一談——你苦等過的那段長間隔,對下一段間隔毫無預示,因為各間隔彼此獨立。這個悖論講的是你 *身在其中* 的那段間隔,由你在何處抽樣所決定,而非對未來間隔的任何預測。