为什么简单的事反而难

莫拉维克悖论：被颠倒的难度表

让一个人心算 4827 乘以 391，他会冒汗；让他拿起一只咖啡杯、穿过堆满杂物的房间、认出朋友的脸，他想都不用想就做到了。对机器人来说，难度恰好反过来：算术轻而易举，而那只杯子、那段路、那张脸却难如登天。这种颠倒被称为莫拉维克悖论。

为什么？机器人学家汉斯·莫拉维克把原因归于进化。那些对我们毫不费力的本事——看、抓、平衡、读懂一个房间的气氛——在生物学上是最古老的，被数亿年的生存压力反复打磨。它们运行在庞大而无声的神经机器上，从不进入意识，所以才显得毫不费力。像代数这样的抽象推理只是薄薄一层近代产物，不过几千年历史，于是它又慢又费劲——恰恰因为它太新了。

所以我们引以为傲的那些事——下棋、逻辑、计算——反而最容易自动化，因为它们早已被写成清晰的规则。而我们从不在意的那些事——摸到袜口的边缘、脚一滑立刻稳住自己——才是最难的，因为从来没人写下规则；进化把它们直接烙进了我们的身体。

现实鸿沟：完美代码撞上凌乱的硬件

还有第二道更阴险的鸿沟。你写好一个控制器，在仿真器里测试，机器人连续走上一千次都完美无瑕；然后把一模一样的代码装进真机——它第一步就摔了。这种痛苦的意外有个名字：现实鸿沟。

原因简单却顽固：仿真器只是一个模型，而没有任何模型能完美还原现实。关节里真实的摩擦，永远不等于你输入的那个干净数字。接触——脚或指尖触到东西的那一瞬间——是出了名地难以仿真，充满细微的打滑与挤压。传感器还要再添一层杂质：每一次读数都带着一点噪声和漂移。把上百个小小的偏差叠加起来，精心调好的控制器就偏离了剧本。

请注意，莫拉维克悖论和现实鸿沟其实是同一枚硬币的两面。它们都在说：物理世界比任何干净的规则或模型都更丰富、更凌乱。走路之所以难，和仿真之所以漏，是同一个原因——接触、摩擦和噪声无处不在，它们拒绝被完整地写下来。

六十年来对鸿沟的逐点凿击

机器人学的历史，很大程度上就是一支支团队逐点凿击这两道鸿沟的故事。而第一步大动作，是干脆把它们绕开。

1961 年——Unimate。第一台工业机器人 Unimate 上岗，在通用汽车的生产线上搬运滚烫的压铸件。它的诀窍是回避难题：把它固定住，给它一段写死的脚本，排除一切意外。没有视觉，没有平衡，没有凌乱的接触——只是永远重复同一个精确动作。
1970 至 90 年代——先感知，再规划，后行动。当机器人走出固定的笼子，研究者搭建了感知—规划—行动回路：读取世界、算出计划、移动、再来一遍。它能用，但很慢——每一步都依赖一个关于世界的模型，而现实鸿沟不断惩罚这些模型里的漏洞。
2004 至 2015 年——DARPA 的跃迁。DARPA 挑战赛让汽车穿越沙漠，让人形机器人走过灾难场地。它们迫使机器人应对没有剧本的真实世界——开阔地形、瓦砾、门——这门学科也痛苦地认清了：现实鸿沟到底有多宽。
2015 年至今——用学习取代写死脚本。机器人不再靠手写每一条规则，而是从数据、从数百万次仿真试验中学习，再用域随机化之类的技巧跨越鸿沟。正是这样，一只机器狗学会爬过从未见过的瓦砾，一只机械手学会翻转一个物件。

每个时代都没有抹掉这两道鸿沟，而是把它们收窄了一点。Unimate 回避它们，感知—规划—行动正面迎击它们，DARPA 丈量它们，而基于学习的方法正在慢慢把它们填上——尤其是那些曾经不可能的"简单"本事，比如在崎岖地面上行走、稳稳地抓握。

启示：智能存在于身体之中

如果两道鸿沟都来自同一处——物理世界那未被写下的丰富性——那么把它们统一起来的启示也是同一个观念：具身智能。真实世界里的能力，不只是一个大脑向愚笨的身体下达命令。身体、传感器、接触，甚至四肢的弹性，都在分担一部分"思考"。一只灵巧的手让抓取更容易；有柔顺性的腿在任何控制器反应之前，就已经吸收掉一记踉跄。

这重新定义了整个目标。重点不是造出一个完美的头脑、然后随便装到哪个身体上，而是让身体与行为共同设计，使物理为你所用、而非与你为敌。这正是为什么机器人学有那么大一部分是机械的、物理的，而不只是代码——也是为什么这条学习阶梯接下来会把时间花在关节、传感器、接触和控制上，而不只是抽象推理。