一個含義過載的詞
你已經沿著這架梯子爬了很遠。你明白 神經網路 如何擬合資料,明白 縮放定律 為何能穩定地讓更大的模型變得更強,也明白一個對話模型如何變成會使用工具的 智能體。於是你已經準備好面對那個籠罩在這一切之上、卻比任何問題都更常被問得糟糕的問題:通用人工智慧會到來嗎,何時到來?誠實的第一步不是給答案,而是坦白——這個術語本身就是滑溜溜的。
今天的大多數系統都是 狹義 AI:在某條溝槽裡出類拔萃——下棋、蛋白質折疊、起草郵件——一出溝槽就淺得很。AGI 則是想像中的反面:一個單一系統,能在一個能幹的人所能勝任的全部任務廣度上學習和推理,並能上手它從未被訓練過的新領域。但請注意,這裡沒有公認的測試,沒有刻度盤上的數字。有人指的是「在大多數有經濟價值的工作上勝過人類」,有人指的是「真正理解」,還有人不過是指「它讓我驚嘆」。當一個詞什麼都涵蓋時,它其實什麼也沒度量。
AGI、超級智慧,以及兩者之間的階梯
把人們常常混為一談的三個台階分開來看,會很有幫助。今天能力強但狹窄的系統是一個台階。AGI——具備人類水準的廣度與適應力——是假想中的下一個台階。而 [[superintelligence|超級智慧]],一個在幾乎所有方面都遠超最優秀人類的系統,則是再往上的一個台階。這並不是同一個論斷,而且支持其中一個的證據,並不構成支持另一個的證據。一個能出色起草程式碼的模型,是第一個台階上的真實進展;它並不是為第三個台階預付的定金。
從第二台階躍到第三台階,正是推測最熾熱的地方。經典論證是「遞迴自我改進」:如果一個系統在 AI 研究本身上達到了人類水準,它或許能改進它的後繼者,後者再改進下一個,如此往復——而且很快。這是一個自洽的故事,值得認真對待,但它是故事,不是測量。它預設智慧是一個單一的量,你可以不斷往上擰,而不會撞上資料、能源、實驗時間或單純的邊際收益遞減這些牆。我們從未觀測到這樣的失控過程,而我們確實觀測到的 縮放定律,描述的是平滑而昂貴的進步——不是爆炸。
為什麼時間表只是披著實驗室外套的猜測
對 AI 研究者的調查所給出的 AGI 估計,從幾年到「永遠不會」都有,而且中位數會隨著新聞週期的轉動逐年滑動。這種分散並不是專家的失敗;它本身就是誠實的信號。我們是在試圖預測一個我們尚且無法定義、無法度量之物的到來,靠的是外推一條我們並不知道其上限在哪的趨勢。在這種條件下做預測,更像是在猜測幾十年後的天氣,而不是預報一次日食。
既有理由誠實地預期進步會很快,也有理由誠實地預期它會放緩——而一個目光清醒的讀者會同時握住這兩者。在「快」的一邊:縮放一直在持續兌現,隨著模型變大,看上去全新的能力不斷冒出來,而把模型變成會用工具的 智能體工作流,又解鎖了純文字預測從未展現過的行為。在「慢」的一邊:唾手可得的訓練資料海洋已大體用盡,每提升一檔能力所需的算力都在指數級地變貴,而人類最難的那些技能——長程規劃、穩健推理、靠寥寥幾個例子就學會——恰恰是今天的系統仍然脆弱之處。
把證據從敘事中剝離出來
這裡最有用的一項本領,就是在腦子裡始終保持兩欄:我們測量到了什麼,以及疊加在上面的故事。證據欄裡放的是你能核對的東西:這個模型在這個基準上得了 X 分,能力隨算力平滑上升,微調與 智能體鷹架擴展了基礎模型的本事。敘事欄裡放的則是疊加在上面的措辭——「它理解了」、「它在推理」、「20XX 年實現 AGI」、「它基本上有意識了」。敘事並不是謊言;它們是解讀。但它們傳播得比證據快,並被當作彷彿就是測量結果。
有兩個反覆出現的陷阱值得起個名字。第一,基準灌水:一個「高分通過律師資格考試」的模型,可能只是匹配到了洩漏進訓練資料裡的答案,而不是真能執業——永遠要問,那份測試題是不是在訓練集裡。第二,擬人化陷阱:因為輸出是流暢的英文,我們就讀出了背後有一顆心靈。古老的 中文房間論證 把這一點說得很尖銳——令人信服地擺弄符號,本身並不構成理解的證明。懷有這份懷疑,並不會讓你變成憤世嫉俗者;它讓你成為一項確實令人印象深刻的技術的細心讀者。
世界模型:問題的關鍵所在
在大量 AGI 爭論的底下,壓著一個技術性的問題:這些系統是否構建了一個 [[world-model-ai|世界模型]]——一種關於事物實際如何運作的、內在而有結構的表徵——還是它們只是在建模文字的統計規律?一個真正的世界模型,能讓你模擬後果、對從未見過的情境進行推理,並察覺到某件事在物理上根本不可能。這大體就是人類所說的「理解」,也正是「通用性」會需要的東西。
誠實的答案是:部分構建了,而我們仍在弄清究竟有多少。探針研究和 機制可解釋性 已經在大模型內部發現了真實的內在結構——在它們的激活空間裡,存在能追蹤概念的方向,甚至在一個只用走子序列訓練的模型內部,發現了小小的、被模擬出來的棋盤。這是真實而出人意料的。但同樣這些模型,也會自信地斷言一磅羽毛比一磅鉛輕,或者憑空捏造一條從不存在的引文。這些失誤並不是疊在「理解」之上的雜訊;它們揭示出:內部的那個模型是斑駁的,是從文字裡縫合起來的,而不是從與世界的接觸裡長出來的。
正因如此,許多研究者認為下一批前沿,並不只是更大的文字模型。通過 具身 AI 把學習扎根於物理世界,或者在 神經-符號 系統中把神經式的模式匹配與顯式推理結合起來,都是這樣一種押注:一個更豐富的世界模型,需要的不止是預測下一個詞元。究竟單憑規模最終能否長出一個完整的世界模型,還是說確實需要某種全新的東西,是幾個偉大的開放問題之一——而且老實說,還沒有人知道答案。
如何妥善地承載這份不確定性
那麼這把你留在了什麼位置上?既不癱瘓,也不皈依任何一方陣營。成熟的立場,是認真對待「變革性 AI」的可能性,同時不假裝我們能給它定下日期。這恰恰是為什麼 AI 安全 與 對齊 研究現在就值得做:不是因為超級智慧定在了下週二,而是因為「對一項強大技術毫無準備」的代價是不對稱的,而且這些工作在今天的系統上同樣有回報。為不確定性做準備,和預測災難,並不是一回事。
把三個經過校準的習慣帶向前。區分各個台階——狹義能力、通用能力、超級智慧——絕不讓某個論證在它們之間悄悄跳躍。把證據欄和敘事欄分開,尤其是在某條頭條讓你興奮或害怕的時候。並且把「我們不知道」當成一個體面的、科學的答案,而不是搪塞。最懂這個領域的人,往往正是最坦然說出這句話的人。同時握住希望與懷疑,你對這片前沿的判讀,會比幾乎所有為它高聲叫嚷的人都更清晰。