通用人工智慧：炒作、希望與誠實的不確定性

一個含義過載的詞

你已經沿著這架梯子爬了很遠。你明白神經網路如何擬合資料，明白縮放定律為何能穩定地讓更大的模型變得更強，也明白一個對話模型如何變成會使用工具的智能體。於是你已經準備好面對那個籠罩在這一切之上、卻比任何問題都更常被問得糟糕的問題：通用人工智慧會到來嗎，何時到來？誠實的第一步不是給答案，而是坦白——這個術語本身就是滑溜溜的。

今天的大多數系統都是狹義 AI：在某條溝槽裡出類拔萃——下棋、蛋白質折疊、起草郵件——一出溝槽就淺得很。AGI 則是想像中的反面：一個單一系統，能在一個能幹的人所能勝任的全部任務廣度上學習和推理，並能上手它從未被訓練過的新領域。但請注意，這裡沒有公認的測試，沒有刻度盤上的數字。有人指的是「在大多數有經濟價值的工作上勝過人類」，有人指的是「真正理解」，還有人不過是指「它讓我驚嘆」。當一個詞什麼都涵蓋時，它其實什麼也沒度量。

AGI、超級智慧，以及兩者之間的階梯

把人們常常混為一談的三個台階分開來看，會很有幫助。今天能力強但狹窄的系統是一個台階。AGI——具備人類水準的廣度與適應力——是假想中的下一個台階。而 [[superintelligence|超級智慧]]，一個在幾乎所有方面都遠超最優秀人類的系統，則是再往上的一個台階。這並不是同一個論斷，而且支持其中一個的證據，並不構成支持另一個的證據。一個能出色起草程式碼的模型，是第一個台階上的真實進展；它並不是為第三個台階預付的定金。

從第二台階躍到第三台階，正是推測最熾熱的地方。經典論證是「遞迴自我改進」：如果一個系統在 AI 研究本身上達到了人類水準，它或許能改進它的後繼者，後者再改進下一個，如此往復——而且很快。這是一個自洽的故事，值得認真對待，但它是故事，不是測量。它預設智慧是一個單一的量，你可以不斷往上擰，而不會撞上資料、能源、實驗時間或單純的邊際收益遞減這些牆。我們從未觀測到這樣的失控過程，而我們確實觀測到的縮放定律，描述的是平滑而昂貴的進步——不是爆炸。

為什麼時間表只是披著實驗室外套的猜測

對 AI 研究者的調查所給出的 AGI 估計，從幾年到「永遠不會」都有，而且中位數會隨著新聞週期的轉動逐年滑動。這種分散並不是專家的失敗；它本身就是誠實的信號。我們是在試圖預測一個我們尚且無法定義、無法度量之物的到來，靠的是外推一條我們並不知道其上限在哪的趨勢。在這種條件下做預測，更像是在猜測幾十年後的天氣，而不是預報一次日食。

既有理由誠實地預期進步會很快，也有理由誠實地預期它會放緩——而一個目光清醒的讀者會同時握住這兩者。在「快」的一邊：縮放一直在持續兌現，隨著模型變大，看上去全新的能力不斷冒出來，而把模型變成會用工具的智能體工作流，又解鎖了純文字預測從未展現過的行為。在「慢」的一邊：唾手可得的訓練資料海洋已大體用盡，每提升一檔能力所需的算力都在指數級地變貴，而人類最難的那些技能——長程規劃、穩健推理、靠寥寥幾個例子就學會——恰恰是今天的系統仍然脆弱之處。

把證據從敘事中剝離出來

這裡最有用的一項本領，就是在腦子裡始終保持兩欄：我們測量到了什麼，以及疊加在上面的故事。證據欄裡放的是你能核對的東西：這個模型在這個基準上得了 X 分，能力隨算力平滑上升，微調與智能體鷹架擴展了基礎模型的本事。敘事欄裡放的則是疊加在上面的措辭——「它理解了」、「它在推理」、「20XX 年實現 AGI」、「它基本上有意識了」。敘事並不是謊言；它們是解讀。但它們傳播得比證據快，並被當作彷彿就是測量結果。

有兩個反覆出現的陷阱值得起個名字。第一，基準灌水：一個「高分通過律師資格考試」的模型，可能只是匹配到了洩漏進訓練資料裡的答案，而不是真能執業——永遠要問，那份測試題是不是在訓練集裡。第二，擬人化陷阱：因為輸出是流暢的英文，我們就讀出了背後有一顆心靈。古老的中文房間論證把這一點說得很尖銳——令人信服地擺弄符號，本身並不構成理解的證明。懷有這份懷疑，並不會讓你變成憤世嫉俗者；它讓你成為一項確實令人印象深刻的技術的細心讀者。

世界模型：問題的關鍵所在

在大量 AGI 爭論的底下，壓著一個技術性的問題：這些系統是否構建了一個 [[world-model-ai|世界模型]]——一種關於事物實際如何運作的、內在而有結構的表徵——還是它們只是在建模文字的統計規律？一個真正的世界模型，能讓你模擬後果、對從未見過的情境進行推理，並察覺到某件事在物理上根本不可能。這大體就是人類所說的「理解」，也正是「通用性」會需要的東西。

誠實的答案是：部分構建了，而我們仍在弄清究竟有多少。探針研究和機制可解釋性已經在大模型內部發現了真實的內在結構——在它們的激活空間裡，存在能追蹤概念的方向，甚至在一個只用走子序列訓練的模型內部，發現了小小的、被模擬出來的棋盤。這是真實而出人意料的。但同樣這些模型，也會自信地斷言一磅羽毛比一磅鉛輕，或者憑空捏造一條從不存在的引文。這些失誤並不是疊在「理解」之上的雜訊；它們揭示出：內部的那個模型是斑駁的，是從文字裡縫合起來的，而不是從與世界的接觸裡長出來的。

正因如此，許多研究者認為下一批前沿，並不只是更大的文字模型。通過具身 AI 把學習扎根於物理世界，或者在神經-符號系統中把神經式的模式匹配與顯式推理結合起來，都是這樣一種押注：一個更豐富的世界模型，需要的不止是預測下一個詞元。究竟單憑規模最終能否長出一個完整的世界模型，還是說確實需要某種全新的東西，是幾個偉大的開放問題之一——而且老實說，還沒有人知道答案。

如何妥善地承載這份不確定性

那麼這把你留在了什麼位置上？既不癱瘓，也不皈依任何一方陣營。成熟的立場，是認真對待「變革性 AI」的可能性，同時不假裝我們能給它定下日期。這恰恰是為什麼 AI 安全與對齊研究現在就值得做：不是因為超級智慧定在了下週二，而是因為「對一項強大技術毫無準備」的代價是不對稱的，而且這些工作在今天的系統上同樣有回報。為不確定性做準備，和預測災難，並不是一回事。

把三個經過校準的習慣帶向前。區分各個台階——狹義能力、通用能力、超級智慧——絕不讓某個論證在它們之間悄悄跳躍。把證據欄和敘事欄分開，尤其是在某條頭條讓你興奮或害怕的時候。並且把「我們不知道」當成一個體面的、科學的答案，而不是搪塞。最懂這個領域的人，往往正是最坦然說出這句話的人。同時握住希望與懷疑，你對這片前沿的判讀，會比幾乎所有為它高聲叫嚷的人都更清晰。