壓軸:本階梯每件工具的歸宿
你現在握有整套條件工具。你知道「得知某事發生」意味著把樣本空間縮小到與之相容的那些情形;你知道貝氏定理能把 P(證據 given 原因) 翻轉成 P(原因 given 證據);你也知道獨立是一種特殊而脆弱的情形,而非預設。這最後一篇完全不講新理論。相反地,它把你已有的一切瞄準兩道幾乎騙倒所有人的謎題——其中還包括出名地被騙的職業數學家——然後看著困惑蒸發。
為什麼要用「謎題」為一個正經的階梯收尾?因為它們不是客廳裡的把戲。蒙提霍爾問題是一堂乾淨的課,教你資訊「抵達的方式」如何改變它所告訴你的內容;而基率謬誤則是醫學、法律與安全領域中代價最昂貴的單一推理錯誤——數十億美元與真實的牢獄之災,都繫於把它弄對。如果你能「感覺到」這些答案為什麼正確,而不只是被動接受,那你就把條件機率學進骨子裡了。
蒙提霍爾:三扇門與一位知情的主持人
這就是蒙提霍爾問題。三扇門;一扇後面是車,另外兩扇後面是羊。你選一扇——比如門 1——但它保持關著。主持人「知道」車在哪,他打開另外兩扇門中的一扇露出一隻羊——比如門 3——然後讓你換到門 2。你該換嗎?直覺尖叫:「現在是 50/50 啊,剩兩扇門,誰在乎。」直覺錯了。換門有 2/3 的勝率;不換只有 1/3。
看穿它最乾淨的方式,是拒絕「門一打開就從頭重算」的誘惑,改問你「原本」那一選值多少。當你最初選了門 1,你有 1/3 的機率押中車、2/3 的機率押中羊——主持人之後做的任何事都不會改變這第一個數字,因為他從不打開你選的那扇門。所以有 2/3 的時候,車在「另外」兩扇門之一後面。接著主持人很貼心地把那兩扇裡空的那扇移走了。這意味著:每當車本來就在那邊(機率 2/3),它現在就坐在僅剩的那扇「另一扇」門後。換門,就把整個 2/3 收進口袋。
為了確認,把它寫成條件機率。設車均勻地在任一扇門後,所以每個先驗是 1/3。你選了門 1;主持人打開門 3 露出一隻羊。在每種隱藏真相之下,「這個觀察」的概似是多少?若車在 1 後,主持人可開 2 或 3,他選 3 的機率是 1/2。若車在 2 後,他被迫開 3,機率為 1。若車在 3 後,他永遠不會打開它,機率為 0。把這些代進貝氏定理,門 2 的後驗恰好算出 2/3。
Prior P(car) each door = 1/3
You pick door 1. Host opens door 3 showing a goat.
P(host opens 3 | car behind 1) = 1/2 (free choice of 2 or 3)
P(host opens 3 | car behind 2) = 1 (forced: can't open 1 or 2)
P(host opens 3 | car behind 3) = 0 (never reveals the car)
Bayes (door 2):
P(car 2 | open 3) = (1 * 1/3) / (1/2*1/3 + 1*1/3 + 0*1/3)
= (1/3) / (1/2) = 2/3
P(car 1 | open 3) = (1/2 * 1/3) / (1/2) = 1/3
=> Switch to door 2. Win probability 2/3.隱藏的關鍵:知情的主持人,對上笨手笨腳的
為什麼這感覺如此違和?因為直覺悄悄假設那扇打開的門只是中性的佈景,而事實上它是「一個知道答案的人傳來的訊息」。設想一組對照。假設換成一位「並不」知道車在哪的笨手助理,隨手撞開一扇門,剛好露出一隻羊。此時換與不換才真的是 50/50——因為在那個世界裡,助理有時會「意外」露出車,而「他露出的是羊」這件事本身攜帶了不同的資訊。同一扇開著的門、同一隻羊,機率卻完全不同。資訊活在「過程」裡,不在「畫面」裡。
如果三扇門還是滑溜溜抓不住,就放大——這正是說服幾乎所有人的訣竅。想像 100 扇門。你選了一扇(押中車的機率 1/100)。知情的主持人接著打開其餘 99 扇中的 98 扇,每一扇都是羊,只留下一扇別的門關著。你要死守你那孤零零的 1/100 第一猜,還是換到那扇——主持人在掃掉 98 扇錯門之後,刻意留下不動的——門?此時換門顯然有 99/100 的勝率。三扇門的版本是同一個效應,只是小到直覺感覺不到。
基率謬誤:檢驗很準,而你很可能沒事
現在來看一道有真實賭注的謎題。某疾病的盛行率是千分之一。有一種檢驗「準確率 99%」:它標出 99% 的病人(敏感度),也正確地放行 99% 的健康者(即 1% 的偽陽性率)。你檢驗呈陽性。你該多擔心?大多數人,連醫生在內,會脫口而出「99%」。誠實的答案大約是 9%。你仍然遠比生病更可能是健康的。這個錯誤就是基率謬誤:忽略了這病一開始有多罕見——也就是先驗,那個基率。
最快的解藥,是去數真實的人,而不是把百分比拋來拋去。想像有 100,000 人接受檢驗。其中約 100 人是真的生病(千分之一),檢驗標出了其中 99 人——這是真陽性。但有 99,900 人是健康的,而「他們」當中也有 1% 驗出陽性:那是 999 個假警報。所以在所有看到陽性結果的人裡,99 人生病、999 人沒病。你真的生病的機率是 99 /(99 + 999)= 99 / 1098 ≈ 0.09。健康族群龐大到,連它區區 1% 的錯誤率,都能把那寥寥幾個真病例埋沒掉。
- 寫下先驗(基率):P(生病) = 0.001,所以 P(健康) = 0.999。這正是人人遺忘的那個數字。
- 寫下概似:P(陽性 given 生病) = 0.99,P(陽性 given 健康) = 0.01。
- 用全機率算分母:P(陽性) = 0.99 * 0.001 + 0.01 * 0.999 = 0.00099 + 0.00999 = 0.01098。
- 用貝氏算後驗:P(生病 given 陽性) = 0.00099 / 0.01098 ≈ 0.090——約 9%,而非 99%。
同一個陷阱,許多張臉——以及如何別掉進去
基率謬誤善於喬裝。在法庭上它化身為檢察官謬誤:「這份 DNA 與一個無辜者吻合的機率是百萬分之一,所以被告必然有罪。」這把 P(吻合 given 無辜) 與 P(無辜 given 吻合) 搞混了——正是貝氏定理存在來糾正的那次翻轉。在一座千萬人口的城市裡,百萬分之一的吻合率意味著大約有十個無辜者也會吻合,所以光憑一次吻合,有罪的後驗仍遠低於確定。和那道醫學檢驗同樣的算術,賭注卻高得多。
有一個俐落的辦法能把這一切理清,前一篇講勝算的指南已經暗示過:用勝算與概似比來想。從先驗勝算起步——對這疾病而言,是 1 比 999 的不利勝算。證據把這勝算乘上概似比 P(陽性 given 生病) / P(陽性 given 健康) = 0.99 / 0.01 = 99。於是後驗勝算是 99 比 999,約等於 1 比 10——大致 9% 的機率,與我們數人頭的結果分毫不差。證據不會「設定」你的相信;它「乘上」你的先驗勝算。忘了先驗,你就丟掉了一半的計算。
這就為整個階梯收尾了。回頭看看是什麼貫穿了每一篇:機率不是貼在事件上的固定標籤,而是一個在資訊抵達時「應當移動」的數字——靠條件,它縮小樣本空間;靠全機率,它從各部分組裝出整體;靠貝氏,它反轉推論的箭頭。蒙提霍爾與基率謬誤,不過就是當人們對錯的東西做更新、或乾脆忘了對基率做更新時,會發生的事。你現在有了把它做對的機器——也有了眼力,能瞬間看出別人哪裡沒做對。