AI 現在能做什麼、還做不到什麼

兩個同時成立的事實

你已經把 [[artificial-intelligence|AI]] 作為一個領域認識了一遍，走過了它的歷史，也見識了機器從資料中學習的那幾種主要方式。現在，最重要、也最常被濫用的問題來了：今天的系統到底能做什麼，又會在哪裡崩掉？把這一點想清楚，你就既不容易被吹捧唬弄，也不容易被恐慌嚇住。

有兩個事實同時成立，而初學者往往只抓住其中一個。第一：現代 AI 的能力是真真切切、令人瞠目的。它能寫出流暢的文章，能在幾乎沒怎麼訓練過的語言之間互譯，能發現放射科醫師漏看的腫瘤，能把圍棋下得比任何在世的人都好。這些都不是花招。第二：恰恰是同一批系統，會自信滿滿地犯下連一個細心的孩子都不會犯的荒唐錯誤——而且常常無法告訴你它其實沒把握。

模式匹配不等於理解

下面這一個觀念，能解釋 AI 大多數古怪行為。一個訓練好的模型，歸根結底是一台異常豐富的模式匹配器。它見過浩如煙海的例子，學會了它們的統計形狀——哪些像素往往意味著「貓」，哪些詞往往接在哪些詞後面。當你的問題落在它學到的那個形狀之內，答案就顯得近乎神奇；一旦落到了形狀之外，神奇便煙消雲散。

這正是為什麼一個 [[large-language-model|大語言模型]] 能給你寫出十四行詩，卻又堅稱 9.11 比 9.9 大。它並不是像你那樣在推理數量的大小，而是在預測下一個看起來合理的詞元。那段文字之所以*看上去*像理解，是因為它本就是被塑造來產出流暢語言的。真正的理解——一個關於世界如何運轉的穩定內在模型——則是一件被宣稱的遠多於被證明的東西。

哲學家們為的正是這件事爭論了幾十年——中文房間論證追問的是：按規則擺弄符號，無論擺弄得多麼以假亂真，是否真的等於*理解*了它們的含義。你不需要去裁決這場辯論。你只需要那個實用的結論：一個能出色匹配模式的系統，可能因為錯誤的理由而答對，而這正是它的錯誤如此難以預料的原因。

三種經典的失效方式

如果說模式匹配是病因，那麼有三種失效就是你會一再遇到的症狀。記住它們的名字，你就會開始處處認出它們——在新聞裡，在示範中，在你自己的實驗裡。

脆弱性。 一個在測試集上拿到 99% 的模型，面對在我們看來差別微不足道的輸入，卻可能徹底崩盤。在影像上做幾個肉眼看不見的像素改動，一個自信的「熊貓」就會變成一個自信的「長臂猿」——這種精心構造的把戲，叫做對抗樣本。更常見的是，一個用乾淨的白天照片訓練出來的模型，到了黃昏可能就手足無措。這種在條件變化下的脆弱，技術上叫做穩健性差，它正是一個光鮮示範與一個能在真實世界活下來的部署系統之間的鴻溝。

偏見。 模型學到的，是它被展示的那個世界，連同其中的瑕疵一併照單全收。如果訓練裡「醫師」的照片大多是男性，模型就會悄悄學到這種相關性，並把它再現出來。這種演算法偏見並不是機器在使壞——而是機器忠實於有缺陷的資料，這反而更糟，因為它把缺陷成倍放大，又藏在一層「客觀」的外衣之下。

幻覺。 一個生成式模型會滿懷自信地編造出一條根本不存在的引文、判例或 API。這就是幻覺，它直接源於模型的工作方式：它被造來產出流暢、貌似合理的文本，而「貌似合理」並不等於「真實」。模型內部沒有事實核查器；它並不知道自己有哪些不知道。這也正是為什麼應對之道，是把它接在真實來源上，並始終保留一個人在環路之中。

狹窄的高超，而非通用的智能

今天部署出來的幾乎一切，都是 [[narrow-ai|窄人工智慧]]：在一項任務上極其出色，離開這項任務一步就束手無策的系統。那個把特級大師輾壓得潰不成軍的西洋棋引擎，連給你沖杯咖啡都做不到，甚至理解不了這個請求。今天的聊天機器人之所以感覺更寬，是因為語言無所不及——但話題的寬並不等於*能力*的寬。往邊緣上一推，狹窄就露了出來。

那個能像人一樣靈活勝任任何任務的單一系統之夢——通用人工智慧——今天並不存在，也沒有人能誠實地告訴你它何時、乃至是否會到來。當一個自信的示範被人悄悄外推成一句「通用智慧即將到來」的宏大斷言時，你尤其要提高警惕。亮眼的狹窄成果是真的；而跨向通用能力的那一躍，是一個假設，而非一個事實。

一個有用的本能反應：每當你看到一個驚豔的成果，就問一句「這條溝槽有多窄？」一個在實驗室裡命中 95% 準確率的模型，一旦真實世界不再像它的訓練資料，就可能泛化得很差——這種偏移，業內稱為分布漂移。投影片上那個數字，並不是對你處境的承諾。

建立經得起檢驗的預期

那麼，要怎樣建立起不會一接觸現實就破碎的預期呢？辦法不是去背誦 AI 能做什麼、不能做什麼——那份清單每隔幾個月就會變——而是對任何一個說法都問出正確的問題。下面這張清單，你可以帶進每一場示範、每一條頭條裡。

任務有多窄？一個在世界某一小塊上得到驗證的模型，很少能乾淨地遷移到另一塊。問問它到底是用什麼訓練、又是在什麼上測試的。
它出錯時會怎樣？一個錯誤的電影推薦無傷大雅；一個錯誤的醫療或法律答案則不然。讓你的信任程度，去匹配失敗的代價。
系統能告訴你它沒把握嗎？大多數都不能，而自信的語氣並不是正確的證據。把流暢當成一種風格，而不是一種證明。
還有人在環路裡嗎？對任何要緊的事，可靠的模式都是機器起草、人來拍板——而不是機器獨自下結論。

第四步裡的那個模式，有一個值得記住的名字：人在環路。今天最成功的真實世界 AI，很少徹底取代一個人。它接手那大批量、例行的部分——這是一種自動化——而由人來掌管那些需要判斷的抉擇、那些邊緣情形，以及那份責任。圍繞這種分工去做設計，通常比把整個任務都押在模型身上要明智得多。

answer = model.generate(question)
if answer.is_high_stakes or answer.confidence_is_unverifiable:
    answer = human_reviews(answer)   # don't ship raw model output
act_on(answer)

一個可靠的真實 AI 系統的樣子：模型提出建議，人來核查那些後果重大的部分，然後才去據此行動。

同時握住兩個真相

吹捧與末日，是兩個容易掉進去的誤區，而它們其實是彼此的鏡像：兩者都把 AI 想像得比實際更統一、更自主。誠實的立場更難，卻也有用得多——同時握住兩個真相。這些系統既真正強大，又真正受限，常常就在同一口氣裡同時成立；那個能把你的郵件起草得無懈可擊的模型，下一行就可能編出一個事實。

至此，「基礎」這一階就算走完了。你現在知道了 AI 是什麼、從何而來、機器如何學習、它們學習的主要方式，以及——最重要的——如何以清醒的眼光去掂量任何一個關於 AI 的說法。從這裡往上，階梯將開始揭開引擎蓋：先是支撐學習的那一小撮數學，接著是資料，再接著是演算法本身。你會把那個最寶貴的習慣一路帶進去——那個不只問「它能不能？」，更要問「它會在哪裡崩掉？」的本能。