JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

通用人工智能:炒作、希望与诚实的不确定性

"通用人工智能即将到来"是科技圈最响亮、也最难界定的论断。本指南为你拆解 AGI 与超级智能究竟指什么、为什么每一份时间表都只是披着实验室外套的猜测,以及如何在不被炒作或末日论裹挟的情况下读懂这个领域的证据。

一个含义过载的词

你已经沿着这架梯子爬了很远。你明白 神经网络 如何拟合数据,明白 缩放定律 为何能稳定地让更大的模型变得更强,也明白一个对话模型如何变成会使用工具的 智能体。于是你已经准备好面对那个笼罩在这一切之上、却比任何问题都更常被问得糟糕的问题:通用人工智能会到来吗,何时到来?诚实的第一步不是给答案,而是坦白——这个术语本身就是滑溜溜的。

今天的大多数系统都是 狭义 AI:在某条沟槽里出类拔萃——下棋、蛋白质折叠、起草邮件——一出沟槽就浅得很。AGI 则是想象中的反面:一个单一系统,能在一个能干的人所能胜任的全部任务广度上学习和推理,并能上手它从未被训练过的新领域。但请注意,这里没有公认的测试,没有刻度盘上的数字。有人指的是"在大多数有经济价值的工作上胜过人类",有人指的是"真正理解",还有人不过是指"它让我惊叹"。当一个词什么都涵盖时,它其实什么也没度量。

AGI、超级智能,以及两者之间的阶梯

把人们常常混为一谈的三个台阶分开来看,会很有帮助。今天能力强但狭窄的系统是一个台阶。AGI——具备人类水平的广度与适应力——是假想中的下一个台阶。而 [[superintelligence|超级智能]],一个在几乎所有方面都远超最优秀人类的系统,则是再往上的一个台阶。这并不是同一个论断,而且支持其中一个的证据,并不构成支持另一个的证据。一个能出色起草代码的模型,是第一个台阶上的真实进展;它并不是为第三个台阶预付的定金。

从第二台阶跃到第三台阶,正是推测最炽热的地方。经典论证是"递归自我改进":如果一个系统在 AI 研究本身上达到了人类水平,它或许能改进它的后继者,后者再改进下一个,如此往复——而且很快。这是一个自洽的故事,值得认真对待,但它是故事,不是测量。它预设智能是一个单一的量,你可以不断往上拧,而不会撞上数据、能源、实验时间或单纯的边际收益递减这些墙。我们从未观测到这样的失控过程,而我们确实观测到的 缩放定律,描述的是平滑而昂贵的进步——不是爆炸。

为什么时间表只是披着实验室外套的猜测

对 AI 研究者的调查所给出的 AGI 估计,从几年到"永远不会"都有,而且中位数会随着新闻周期的转动逐年滑动。这种分散并不是专家的失败;它本身就是诚实的信号。我们是在试图预测一个我们尚且无法定义、无法度量之物的到来,靠的是外推一条我们并不知道其上限在哪的趋势。在这种条件下做预测,更像是在猜测几十年后的天气,而不是预报一次日食。

既有理由诚实地预期进步会很快,也有理由诚实地预期它会放缓——而一个目光清醒的读者会同时握住这两者。在"快"的一边:缩放一直在持续兑现,随着模型变大,看上去全新的能力不断冒出来,而把模型变成会用工具的 智能体工作流,又解锁了纯文本预测从未展现过的行为。在"慢"的一边:唾手可得的训练数据海洋已大体用尽,每提升一档能力所需的算力都在指数级地变贵,而人类最难的那些技能——长程规划、稳健推理、靠寥寥几个例子就学会——恰恰是今天的系统仍然脆弱之处。

把证据从叙事中剥离出来

这里最有用的一项本领,就是在脑子里始终保持两栏:我们测量到了什么,以及叠加在上面的故事。证据栏里放的是你能核对的东西:这个模型在这个基准上得了 X 分,能力随算力平滑上升,微调与 智能体脚手架扩展了基础模型的本事。叙事栏里放的则是叠加在上面的措辞——"它理解了"、"它在推理"、"20XX 年实现 AGI"、"它基本上有意识了"。叙事并不是谎言;它们是解读。但它们传播得比证据快,并被当作仿佛就是测量结果。

有两个反复出现的陷阱值得起个名字。第一,基准灌水:一个"高分通过律师资格考试"的模型,可能只是匹配到了泄漏进训练数据里的答案,而不是真能执业——永远要问,那份测试题是不是在训练集里。第二,拟人化陷阱:因为输出是流畅的英文,我们就读出了背后有一颗心灵。古老的 中文房间论证 把这一点说得很尖锐——令人信服地摆弄符号,本身并不构成理解的证明。怀有这份怀疑,并不会让你变成愤世嫉俗者;它让你成为一项确实令人印象深刻的技术的细心读者。

世界模型:问题的关键所在

在大量 AGI 争论的底下,压着一个技术性的问题:这些系统是否构建了一个 [[world-model-ai|世界模型]]——一种关于事物实际如何运作的、内在而有结构的表征——还是它们只是在建模文本的统计规律?一个真正的世界模型,能让你模拟后果、对从未见过的情境进行推理,并察觉到某件事在物理上根本不可能。这大体就是人类所说的"理解",也正是"通用性"会需要的东西。

诚实的答案是:部分构建了,而我们仍在弄清究竟有多少。探针研究和 机制可解释性 已经在大模型内部发现了真实的内在结构——在它们的激活空间里,存在能追踪概念的方向,甚至在一个只用走子序列训练的模型内部,发现了小小的、被模拟出来的棋盘。这是真实而出人意料的。但同样这些模型,也会自信地断言一磅羽毛比一磅铅轻,或者凭空捏造一条从不存在的引文。这些失误并不是叠在"理解"之上的噪声;它们揭示出:内部的那个模型是斑驳的,是从文本里缝合起来的,而不是从与世界的接触里长出来的。

正因如此,许多研究者认为下一批前沿,并不只是更大的文本模型。通过 具身 AI 把学习扎根于物理世界,或者在 神经-符号 系统中把神经式的模式匹配与显式推理结合起来,都是这样一种押注:一个更丰富的世界模型,需要的不止是预测下一个词元。究竟单凭规模最终能否长出一个完整的世界模型,还是说确实需要某种全新的东西,是几个伟大的开放问题之一——而且老实说,还没有人知道答案。

如何妥善地承载这份不确定性

那么这把你留在了什么位置上?既不瘫痪,也不皈依任何一方阵营。成熟的立场,是认真对待"变革性 AI"的可能性,同时不假装我们能给它定下日期。这恰恰是为什么 AI 安全对齐 研究现在就值得做:不是因为超级智能定在了下周二,而是因为"对一项强大技术毫无准备"的代价是不对称的,而且这些工作在今天的系统上同样有回报。为不确定性做准备,和预测灾难,并不是一回事。

把三个经过校准的习惯带向前。区分各个台阶——狭义能力、通用能力、超级智能——绝不让某个论证在它们之间悄悄跳跃。把证据栏和叙事栏分开,尤其是在某条头条让你兴奋或害怕的时候。并且把"我们不知道"当成一个体面的、科学的答案,而不是搪塞。最懂这个领域的人,往往正是最坦然说出这句话的人。同时握住希望与怀疑,你对这片前沿的判读,会比几乎所有为它高声叫嚷的人都更清晰。