莫拉维克悖论:被颠倒的难度表
让一个人心算 4827 乘以 391,他会冒汗;让他拿起一只咖啡杯、穿过堆满杂物的房间、认出朋友的脸,他想都不用想就做到了。对机器人来说,难度恰好反过来:算术轻而易举,而那只杯子、那段路、那张脸却难如登天。这种颠倒被称为莫拉维克悖论。
为什么?机器人学家汉斯·莫拉维克把原因归于进化。那些对我们毫不费力的本事——看、抓、平衡、读懂一个房间的气氛——在生物学上是最古老的,被数亿年的生存压力反复打磨。它们运行在庞大而无声的神经机器上,从不进入意识,所以才显得毫不费力。像代数这样的抽象推理只是薄薄一层近代产物,不过几千年历史,于是它又慢又费劲——恰恰因为它太新了。
所以我们引以为傲的那些事——下棋、逻辑、计算——反而最容易自动化,因为它们早已被写成清晰的规则。而我们从不在意的那些事——摸到袜口的边缘、脚一滑立刻稳住自己——才是最难的,因为从来没人写下规则;进化把它们直接烙进了我们的身体。
现实鸿沟:完美代码撞上凌乱的硬件
还有第二道更阴险的鸿沟。你写好一个控制器,在仿真器里测试,机器人连续走上一千次都完美无瑕;然后把一模一样的代码装进真机——它第一步就摔了。这种痛苦的意外有个名字:现实鸿沟。
原因简单却顽固:仿真器只是一个模型,而没有任何模型能完美还原现实。关节里真实的摩擦,永远不等于你输入的那个干净数字。接触——脚或指尖触到东西的那一瞬间——是出了名地难以仿真,充满细微的打滑与挤压。传感器还要再添一层杂质:每一次读数都带着一点噪声和漂移。把上百个小小的偏差叠加起来,精心调好的控制器就偏离了剧本。
请注意,莫拉维克悖论和现实鸿沟其实是同一枚硬币的两面。它们都在说:物理世界比任何干净的规则或模型都更丰富、更凌乱。走路之所以难,和仿真之所以漏,是同一个原因——接触、摩擦和噪声无处不在,它们拒绝被完整地写下来。
六十年来对鸿沟的逐点凿击
机器人学的历史,很大程度上就是一支支团队逐点凿击这两道鸿沟的故事。而第一步大动作,是干脆把它们绕开。
- 1961 年——Unimate。第一台工业机器人 Unimate 上岗,在通用汽车的生产线上搬运滚烫的压铸件。它的诀窍是回避难题:把它固定住,给它一段写死的脚本,排除一切意外。没有视觉,没有平衡,没有凌乱的接触——只是永远重复同一个精确动作。
- 1970 至 90 年代——先感知,再规划,后行动。当机器人走出固定的笼子,研究者搭建了感知—规划—行动回路:读取世界、算出计划、移动、再来一遍。它能用,但很慢——每一步都依赖一个关于世界的模型,而现实鸿沟不断惩罚这些模型里的漏洞。
- 2004 至 2015 年——DARPA 的跃迁。DARPA 挑战赛让汽车穿越沙漠,让人形机器人走过灾难场地。它们迫使机器人应对没有剧本的真实世界——开阔地形、瓦砾、门——这门学科也痛苦地认清了:现实鸿沟到底有多宽。
- 2015 年至今——用学习取代写死脚本。机器人不再靠手写每一条规则,而是从数据、从数百万次仿真试验中学习,再用域随机化之类的技巧跨越鸿沟。正是这样,一只机器狗学会爬过从未见过的瓦砾,一只机械手学会翻转一个物件。
每个时代都没有抹掉这两道鸿沟,而是把它们收窄了一点。Unimate 回避它们,感知—规划—行动正面迎击它们,DARPA 丈量它们,而基于学习的方法正在慢慢把它们填上——尤其是那些曾经不可能的"简单"本事,比如在崎岖地面上行走、稳稳地抓握。
启示:智能存在于身体之中
如果两道鸿沟都来自同一处——物理世界那未被写下的丰富性——那么把它们统一起来的启示也是同一个观念:具身智能。真实世界里的能力,不只是一个大脑向愚笨的身体下达命令。身体、传感器、接触,甚至四肢的弹性,都在分担一部分"思考"。一只灵巧的手让抓取更容易;有柔顺性的腿在任何控制器反应之前,就已经吸收掉一记踉跄。
这重新定义了整个目标。重点不是造出一个完美的头脑、然后随便装到哪个身体上,而是让身体与行为共同设计,使物理为你所用、而非与你为敌。这正是为什么机器人学有那么大一部分是机械的、物理的,而不只是代码——也是为什么这条学习阶梯接下来会把时间花在关节、传感器、接触和控制上,而不只是抽象推理。