蒙提霍爾問題與基率謬誤

壓軸：本階梯每件工具的歸宿

你現在握有整套條件工具。你知道「得知某事發生」意味著把樣本空間縮小到與之相容的那些情形；你知道貝氏定理能把 P(證據 given 原因) 翻轉成 P(原因 given 證據)；你也知道獨立是一種特殊而脆弱的情形，而非預設。這最後一篇完全不講新理論。相反地，它把你已有的一切瞄準兩道幾乎騙倒所有人的謎題——其中還包括出名地被騙的職業數學家——然後看著困惑蒸發。

為什麼要用「謎題」為一個正經的階梯收尾？因為它們不是客廳裡的把戲。蒙提霍爾問題是一堂乾淨的課，教你資訊「抵達的方式」如何改變它所告訴你的內容；而基率謬誤則是醫學、法律與安全領域中代價最昂貴的單一推理錯誤——數十億美元與真實的牢獄之災，都繫於把它弄對。如果你能「感覺到」這些答案為什麼正確，而不只是被動接受，那你就把條件機率學進骨子裡了。

蒙提霍爾：三扇門與一位知情的主持人

這就是蒙提霍爾問題。三扇門；一扇後面是車，另外兩扇後面是羊。你選一扇——比如門 1——但它保持關著。主持人「知道」車在哪，他打開另外兩扇門中的一扇露出一隻羊——比如門 3——然後讓你換到門 2。你該換嗎？直覺尖叫：「現在是 50/50 啊，剩兩扇門，誰在乎。」直覺錯了。換門有 2/3 的勝率；不換只有 1/3。

看穿它最乾淨的方式，是拒絕「門一打開就從頭重算」的誘惑，改問你「原本」那一選值多少。當你最初選了門 1，你有 1/3 的機率押中車、2/3 的機率押中羊——主持人之後做的任何事都不會改變這第一個數字，因為他從不打開你選的那扇門。所以有 2/3 的時候，車在「另外」兩扇門之一後面。接著主持人很貼心地把那兩扇裡空的那扇移走了。這意味著：每當車本來就在那邊（機率 2/3），它現在就坐在僅剩的那扇「另一扇」門後。換門，就把整個 2/3 收進口袋。

為了確認，把它寫成條件機率。設車均勻地在任一扇門後，所以每個先驗是 1/3。你選了門 1；主持人打開門 3 露出一隻羊。在每種隱藏真相之下，「這個觀察」的概似是多少？若車在 1 後，主持人可開 2 或 3，他選 3 的機率是 1/2。若車在 2 後，他被迫開 3，機率為 1。若車在 3 後，他永遠不會打開它，機率為 0。把這些代進貝氏定理，門 2 的後驗恰好算出 2/3。

Prior P(car)   each door = 1/3
You pick door 1.  Host opens door 3 showing a goat.

P(host opens 3 | car behind 1) = 1/2   (free choice of 2 or 3)
P(host opens 3 | car behind 2) = 1     (forced: can't open 1 or 2)
P(host opens 3 | car behind 3) = 0     (never reveals the car)

Bayes (door 2):
  P(car 2 | open 3) = (1 * 1/3) / (1/2*1/3 + 1*1/3 + 0*1/3)
                    = (1/3) / (1/2) = 2/3
  P(car 1 | open 3) = (1/2 * 1/3) / (1/2) = 1/3

=> Switch to door 2.  Win probability 2/3.

蒙提霍爾背後的貝氏更新——是主持人那個被迫的動作，把勝算扳斜了。

隱藏的關鍵：知情的主持人，對上笨手笨腳的

為什麼這感覺如此違和？因為直覺悄悄假設那扇打開的門只是中性的佈景，而事實上它是「一個知道答案的人傳來的訊息」。設想一組對照。假設換成一位「並不」知道車在哪的笨手助理，隨手撞開一扇門，剛好露出一隻羊。此時換與不換才真的是 50/50——因為在那個世界裡，助理有時會「意外」露出車，而「他露出的是羊」這件事本身攜帶了不同的資訊。同一扇開著的門、同一隻羊，機率卻完全不同。資訊活在「過程」裡，不在「畫面」裡。

如果三扇門還是滑溜溜抓不住，就放大——這正是說服幾乎所有人的訣竅。想像 100 扇門。你選了一扇（押中車的機率 1/100）。知情的主持人接著打開其餘 99 扇中的 98 扇，每一扇都是羊，只留下一扇別的門關著。你要死守你那孤零零的 1/100 第一猜，還是換到那扇——主持人在掃掉 98 扇錯門之後，刻意留下不動的——門？此時換門顯然有 99/100 的勝率。三扇門的版本是同一個效應，只是小到直覺感覺不到。

基率謬誤：檢驗很準，而你很可能沒事

現在來看一道有真實賭注的謎題。某疾病的盛行率是千分之一。有一種檢驗「準確率 99%」：它標出 99% 的病人（敏感度），也正確地放行 99% 的健康者（即 1% 的偽陽性率）。你檢驗呈陽性。你該多擔心？大多數人，連醫生在內，會脫口而出「99%」。誠實的答案大約是 9%。你仍然遠比生病更可能是健康的。這個錯誤就是基率謬誤：忽略了這病一開始有多罕見——也就是先驗，那個基率。

最快的解藥，是去數真實的人，而不是把百分比拋來拋去。想像有 100,000 人接受檢驗。其中約 100 人是真的生病（千分之一），檢驗標出了其中 99 人——這是真陽性。但有 99,900 人是健康的，而「他們」當中也有 1% 驗出陽性：那是 999 個假警報。所以在所有看到陽性結果的人裡，99 人生病、999 人沒病。你真的生病的機率是 99 /（99 + 999）= 99 / 1098 ≈ 0.09。健康族群龐大到，連它區區 1% 的錯誤率，都能把那寥寥幾個真病例埋沒掉。

寫下先驗（基率）：P(生病) = 0.001，所以 P(健康) = 0.999。這正是人人遺忘的那個數字。
寫下概似：P(陽性 given 生病) = 0.99，P(陽性 given 健康) = 0.01。
用全機率算分母：P(陽性) = 0.99 * 0.001 + 0.01 * 0.999 = 0.00099 + 0.00999 = 0.01098。
用貝氏算後驗：P(生病 given 陽性) = 0.00099 / 0.01098 ≈ 0.090——約 9%，而非 99%。

同一個陷阱，許多張臉——以及如何別掉進去

基率謬誤善於喬裝。在法庭上它化身為檢察官謬誤：「這份 DNA 與一個無辜者吻合的機率是百萬分之一，所以被告必然有罪。」這把 P(吻合 given 無辜) 與 P(無辜 given 吻合) 搞混了——正是貝氏定理存在來糾正的那次翻轉。在一座千萬人口的城市裡，百萬分之一的吻合率意味著大約有十個無辜者也會吻合，所以光憑一次吻合，有罪的後驗仍遠低於確定。和那道醫學檢驗同樣的算術，賭注卻高得多。

有一個俐落的辦法能把這一切理清，前一篇講勝算的指南已經暗示過：用勝算與概似比來想。從先驗勝算起步——對這疾病而言，是 1 比 999 的不利勝算。證據把這勝算乘上概似比 P(陽性 given 生病) / P(陽性 given 健康) = 0.99 / 0.01 = 99。於是後驗勝算是 99 比 999，約等於 1 比 10——大致 9% 的機率，與我們數人頭的結果分毫不差。證據不會「設定」你的相信；它「乘上」你的先驗勝算。忘了先驗，你就丟掉了一半的計算。

這就為整個階梯收尾了。回頭看看是什麼貫穿了每一篇：機率不是貼在事件上的固定標籤，而是一個在資訊抵達時「應當移動」的數字——靠條件，它縮小樣本空間；靠全機率，它從各部分組裝出整體；靠貝氏，它反轉推論的箭頭。蒙提霍爾與基率謬誤，不過就是當人們對錯的東西做更新、或乾脆忘了對基率做更新時，會發生的事。你現在有了把它做對的機器——也有了眼力，能瞬間看出別人哪裡沒做對。