更新過程與檢驗悖論

從卜瓦松到更新：放掉指數分配

整整這一級都建立在一個特別的時鐘上。卜瓦松過程計數的是這樣的事件：它們之間的間隔——也就是到達間隔時間——彼此獨立、且服從同一個指數分配，而正是這一個選擇給了我們所有的魔法：獨立增量、無記憶的重啟、乾淨的速率 lambda。但真實世界的到達很少這麼聽話。公車不會無記憶地到站；一顆已經燒了一陣子的燈泡，接下來壞掉的機會通常比一顆全新的更高，而非相等。於是我們問出最自然的下一個問題：如果那些間隔依然獨立同分配、卻不是指數分配，還有什麼會留下來？

這個推廣就是 更新過程（renewal process）。挑任意一個正值到達間隔的分配 F，平均數為 mu = E[X]（我們不再要求 X 是指數的）。從 F 獨立地抽出間隔 X_1、X_2、X_3、...。到達時刻就是這些累加和 S_n = X_1 + ... + X_n，而計數 N(t) 不過是「到時刻 t 為止已發生幾次到達」。每一次到達都是一次「更新」：在那一瞬間，過程忘掉一切，為下一段間隔從頭開始計時。見更新過程。卜瓦松過程是其中那個特別的成員——F 恰為指數分配；也唯有此時，無記憶性質才成立。

長程的計數：更新函數與基本更新定理

我們最先想知道的是：到時刻 t 為止，平均該期待多少次更新？這個期望計數就是 更新函數（renewal function），m(t) = E[N(t)]。它比看起來難，因為 N(t) 依賴於一整串隨機間隔的和；但它的長程行為卻美得出奇。見更新函數。最重磅的結果——基本更新定理（elementary renewal theorem）——說：更新的長程速率恰好是平均間隔的倒數：當 t 增大時 m(t)/t -> 1/mu。若公車平均每 10 分鐘來一班，那麼漫長的一天裡你大約會見到 t/10 班。不令人意外——但它對 *任何* 平均數為 mu 的間隔分配都成立，無論是不是指數的。

為什麼速率直覺上是 1/mu？由強大數法則，第 n 次到達時刻 S_n = X_1 + ... + X_n 在 n 大時約如 n·mu 般成長：平均間隔安定到 mu。所以第 n 次更新大約發生在時刻 n·mu，這等同於說：到時刻 t 為止，我們大約經歷了 t/mu 次更新。強大數法則做了粗重活；更新定理只是把它的陳述透過計數過程讀出來。這正是更新世界裡那條你早已在卜瓦松過程見過的『lambda = 1/平均間隔』——如今從指數分配中解放了出來。

把這些物件釘牢，它們其實很整齊。間隔 X_1、X_2、... 獨立同分配於 F，平均數 mu = E[X]；到達時刻為 S_n = X_1 + ... + X_n；到時刻 t 的計數為 N(t) = max{ n : S_n <= t }；而更新函數為 m(t) = E[N(t)]。基本更新定理便讀作：當 t -> 無窮時 m(t)/t -> 1/mu。在卜瓦松特例中，F 為 Exponential(lambda)，故 mu = 1/lambda，定理給出 1/mu = lambda——正是你整級用到的那個速率。一個有用的親戚是 更新報酬定理（renewal-reward theorem）：若每次更新帶來一份報酬，你的長程單位時間報酬為 E[報酬]/mu，即同一個 1/mu 的節奏再乘上平均報酬。

那班總是誤點的公車：檢驗悖論

現在來到那個著名的轉折。公車以更新過程到站，平均間隔 mu = 10 分鐘。你在一個隨機的時刻出現，一無所知，等下一班車。常識悄聲說：你落在一段「典型」的間隔裡，所以你的等待平均該約 5 分鐘——10 的一半。常識錯了。你恰好落入的那段間隔，系統性地比平均間隔 *更長*，於是你等的時間也超過 mu 的一半。這就是 檢驗悖論（inspection paradox）。見檢驗悖論。

畫個圖立刻就懂。把所有間隔當作一段段區間排在時間軸上。長間隔在時間軸上覆蓋的範圍比短間隔多——一段 20 分鐘的間隔佔的路，是一段 10 分鐘間隔的兩倍。所以當你在一個隨機瞬間落下，你 *更容易* 落進一段長間隔裡，純粹因為長間隔是更大的標靶。這是對間隔做了「長度偏倚」的抽樣：每段間隔實際上被它自己的長度加權了。短間隔被抽得不足，長間隔被抽得過多，而你親身經歷的那段間隔便相應地被拉長。同一個效應，讓學生體感的平均班級人數，比教務處公布的平均班級人數來得大。

ordinary gap mean:        E[X]     = mu
length-biased gap mean:   E[X^2]/mu  =  mu + Var(X)/mu   >=  mu

  ( equality only when Var(X) = 0, i.e. every gap is exactly mu )

your expected wait for the next event = ( E[X^2] / mu ) / 2   (Poisson case below)

長度偏倚的平均數恆不小於普通平均數，兩者差距恰為 Var(X)/mu——變異性正是這個悖論的全部引擎。

連卜瓦松過程也躲不掉

接下來這一段，真的會讓人吃驚。無記憶的卜瓦松過程總該躲過這個悖論吧？並沒有——而它「躲過」的方式本身就是笑點所在。假設公車是速率 lambda = 1（每 10 分鐘一班）的卜瓦松過程，所以 mu = 10、間隔服從指數分配。由無記憶性，當你抵達時，你等待 *下一班* 車的期望竟是完整的 10 分鐘，而非 5 分鐘：指數分配忘掉了那班已經開走的車，所以你向前的等待看起來像一段全新、完整的間隔。光是這一點就夠驚人了——你的等待等於整個平均間隔，而非它的一半。

現在看看你實際落入的那段間隔：它是你向前的等待，*加上* 距上一班車的時間（你身後的「年齡」）。由無記憶性，向後的年齡同樣是平均數 10 的指數分配，且與向前等待獨立。所以你落入的整段間隔，期望長度是 10 + 10 = 20 分鐘——足足是普通平均數 10 的兩倍！指數分配自身的變異數（這裡 Var(X) = mu^2）直接餵進長度偏倚公式 E[X^2]/mu = 2·mu。卜瓦松過程並沒有閃過檢驗悖論；它展現的是這個悖論最乾淨利落的版本。

先弄清你在抽樣什麼。當你挑一個隨機的 *時間* 點而非一段隨機的間隔時，檢驗悖論就會發作——時間抽樣會以長度加權每段間隔。
對你真正會經歷的那段間隔，計算長度偏倚平均數 E[X^2]/mu，而非普通平均數 mu。
把那段被觀測到的間隔拆成「向前等待 + 向後年齡」；對卜瓦松過程，由無記憶性，每一塊都是平均數 mu 的指數分配。
讀出寓意：你的期望等待是 (E[X^2]/mu)/2，在卜瓦松情形下等於 mu——絕非天真以為的 mu/2。

這為何重要，以及不該下的結論

更新理論是許多領域背後沉默的主力：可靠度工程（反覆更換的零件何時故障？）、排隊論與 M/M/1 佇列、存貨補貨，以及任何「重設後再跑」的系統。基本更新定理告訴你長程速率；更精細的結果如關鍵更新定理，則刻畫穩態下的「年齡」與「剩餘壽命」。而檢驗悖論並非趣聞——它是真實量測中反覆出現的陷阱：使用者體感的平均下載速度、來電者體感的平均等待、乘客體感的平均擁擠程度，全都偏向更糟，因為「體驗」本身被長度偏倚了。

兩點誠實的提醒。其一，這個悖論在邏輯意義上 *並非* 悖論，沒有任何東西出錯——它只反映出兩種不同的抽樣方式（挑一段間隔 vs. 挑一個時間點）給出兩個不同、卻都正確的平均數。公車公司的「平均 10 分鐘」對間隔為真；你的「20 分鐘間隔」對時間點為真。兩者都沒說謊。其二，別把它跟賭徒謬誤或一廂情願的「終會扯平」混為一談——你苦等過的那段長間隔，對下一段間隔毫無預示，因為各間隔彼此獨立。這個悖論講的是你 *身在其中* 的那段間隔，由你在何處抽樣所決定，而非對未來間隔的任何預測。