通用人工智能：炒作、希望与诚实的不确定性

一个含义过载的词

你已经沿着这架梯子爬了很远。你明白神经网络如何拟合数据，明白缩放定律为何能稳定地让更大的模型变得更强，也明白一个对话模型如何变成会使用工具的智能体。于是你已经准备好面对那个笼罩在这一切之上、却比任何问题都更常被问得糟糕的问题：通用人工智能会到来吗，何时到来？诚实的第一步不是给答案，而是坦白——这个术语本身就是滑溜溜的。

今天的大多数系统都是狭义 AI：在某条沟槽里出类拔萃——下棋、蛋白质折叠、起草邮件——一出沟槽就浅得很。AGI 则是想象中的反面：一个单一系统，能在一个能干的人所能胜任的全部任务广度上学习和推理，并能上手它从未被训练过的新领域。但请注意，这里没有公认的测试，没有刻度盘上的数字。有人指的是"在大多数有经济价值的工作上胜过人类"，有人指的是"真正理解"，还有人不过是指"它让我惊叹"。当一个词什么都涵盖时，它其实什么也没度量。

AGI、超级智能，以及两者之间的阶梯

把人们常常混为一谈的三个台阶分开来看，会很有帮助。今天能力强但狭窄的系统是一个台阶。AGI——具备人类水平的广度与适应力——是假想中的下一个台阶。而 [[superintelligence|超级智能]]，一个在几乎所有方面都远超最优秀人类的系统，则是再往上的一个台阶。这并不是同一个论断，而且支持其中一个的证据，并不构成支持另一个的证据。一个能出色起草代码的模型，是第一个台阶上的真实进展；它并不是为第三个台阶预付的定金。

从第二台阶跃到第三台阶，正是推测最炽热的地方。经典论证是"递归自我改进"：如果一个系统在 AI 研究本身上达到了人类水平，它或许能改进它的后继者，后者再改进下一个，如此往复——而且很快。这是一个自洽的故事，值得认真对待，但它是故事，不是测量。它预设智能是一个单一的量，你可以不断往上拧，而不会撞上数据、能源、实验时间或单纯的边际收益递减这些墙。我们从未观测到这样的失控过程，而我们确实观测到的缩放定律，描述的是平滑而昂贵的进步——不是爆炸。

为什么时间表只是披着实验室外套的猜测

对 AI 研究者的调查所给出的 AGI 估计，从几年到"永远不会"都有，而且中位数会随着新闻周期的转动逐年滑动。这种分散并不是专家的失败；它本身就是诚实的信号。我们是在试图预测一个我们尚且无法定义、无法度量之物的到来，靠的是外推一条我们并不知道其上限在哪的趋势。在这种条件下做预测，更像是在猜测几十年后的天气，而不是预报一次日食。

既有理由诚实地预期进步会很快，也有理由诚实地预期它会放缓——而一个目光清醒的读者会同时握住这两者。在"快"的一边：缩放一直在持续兑现，随着模型变大，看上去全新的能力不断冒出来，而把模型变成会用工具的智能体工作流，又解锁了纯文本预测从未展现过的行为。在"慢"的一边：唾手可得的训练数据海洋已大体用尽，每提升一档能力所需的算力都在指数级地变贵，而人类最难的那些技能——长程规划、稳健推理、靠寥寥几个例子就学会——恰恰是今天的系统仍然脆弱之处。

把证据从叙事中剥离出来

这里最有用的一项本领，就是在脑子里始终保持两栏：我们测量到了什么，以及叠加在上面的故事。证据栏里放的是你能核对的东西：这个模型在这个基准上得了 X 分，能力随算力平滑上升，微调与智能体脚手架扩展了基础模型的本事。叙事栏里放的则是叠加在上面的措辞——"它理解了"、"它在推理"、"20XX 年实现 AGI"、"它基本上有意识了"。叙事并不是谎言；它们是解读。但它们传播得比证据快，并被当作仿佛就是测量结果。

有两个反复出现的陷阱值得起个名字。第一，基准灌水：一个"高分通过律师资格考试"的模型，可能只是匹配到了泄漏进训练数据里的答案，而不是真能执业——永远要问，那份测试题是不是在训练集里。第二，拟人化陷阱：因为输出是流畅的英文，我们就读出了背后有一颗心灵。古老的中文房间论证把这一点说得很尖锐——令人信服地摆弄符号，本身并不构成理解的证明。怀有这份怀疑，并不会让你变成愤世嫉俗者；它让你成为一项确实令人印象深刻的技术的细心读者。

世界模型：问题的关键所在

在大量 AGI 争论的底下，压着一个技术性的问题：这些系统是否构建了一个 [[world-model-ai|世界模型]]——一种关于事物实际如何运作的、内在而有结构的表征——还是它们只是在建模文本的统计规律？一个真正的世界模型，能让你模拟后果、对从未见过的情境进行推理，并察觉到某件事在物理上根本不可能。这大体就是人类所说的"理解"，也正是"通用性"会需要的东西。

诚实的答案是：部分构建了，而我们仍在弄清究竟有多少。探针研究和机制可解释性已经在大模型内部发现了真实的内在结构——在它们的激活空间里，存在能追踪概念的方向，甚至在一个只用走子序列训练的模型内部，发现了小小的、被模拟出来的棋盘。这是真实而出人意料的。但同样这些模型，也会自信地断言一磅羽毛比一磅铅轻，或者凭空捏造一条从不存在的引文。这些失误并不是叠在"理解"之上的噪声；它们揭示出：内部的那个模型是斑驳的，是从文本里缝合起来的，而不是从与世界的接触里长出来的。

正因如此，许多研究者认为下一批前沿，并不只是更大的文本模型。通过具身 AI 把学习扎根于物理世界，或者在神经-符号系统中把神经式的模式匹配与显式推理结合起来，都是这样一种押注：一个更丰富的世界模型，需要的不止是预测下一个词元。究竟单凭规模最终能否长出一个完整的世界模型，还是说确实需要某种全新的东西，是几个伟大的开放问题之一——而且老实说，还没有人知道答案。

如何妥善地承载这份不确定性

那么这把你留在了什么位置上？既不瘫痪，也不皈依任何一方阵营。成熟的立场，是认真对待"变革性 AI"的可能性，同时不假装我们能给它定下日期。这恰恰是为什么 AI 安全与对齐研究现在就值得做：不是因为超级智能定在了下周二，而是因为"对一项强大技术毫无准备"的代价是不对称的，而且这些工作在今天的系统上同样有回报。为不确定性做准备，和预测灾难，并不是一回事。

把三个经过校准的习惯带向前。区分各个台阶——狭义能力、通用能力、超级智能——绝不让某个论证在它们之间悄悄跳跃。把证据栏和叙事栏分开，尤其是在某条头条让你兴奋或害怕的时候。并且把"我们不知道"当成一个体面的、科学的答案，而不是搪塞。最懂这个领域的人，往往正是最坦然说出这句话的人。同时握住希望与怀疑，你对这片前沿的判读，会比几乎所有为它高声叫嚷的人都更清晰。