走入真实世界的机器人

为什么“真实世界”才是难点

工厂里的机器人生活在一个被刻意做得很简单的世界里：零件总是出现在同一个位置，光照从不改变，安全围栏把人挡在外面。可一旦走出围栏，一切都会动起来。病人在呼吸，道路上挤满陌生人，泥土今天泥泞、明天干裂。本篇的核心观点很简单：你越无法控制环境，机器人就越要自己携带感知与判断能力。这份随身携带的“聪明”，就是它的自主性。

这里有一条很有用的光谱，通常称为自主等级。一端是人通过机器做完所有事；另一端是机器自己做决定。如今大多数真实世界里的机器人都处在中间某处，本篇接下来就沿着这条光谱，从手术室一路走到另一颗行星。

手术室：人手掌控下的精准

我们先从这些杂乱世界里最受控的一个开始。在手术机器人领域，机器人几乎从不独自行动。外科医生坐在操作台前移动双手；机器人则在病人体内复制这些动作，并加以缩放、滤除颤抖，以更高的精度完成。这就是遥操作——人依然是大脑，机器人则是一双更稳、更小的手。缩放很有帮助：手部一厘米的动作可以缩成器械一毫米的动作，于是人手细微的抖动几乎消失不见。

由于器械接触的是活体组织，单纯的位置指令并不够——硬要推到某个精确点，可能会撕裂柔软的部位。因此手术与辅助系统依赖力控制和阻抗控制：机器人不只判断“去哪里”，还要判断“用多大力气推”，遇到阻力时会温柔地退让。同样的思路也驱动着帮助中风病人重新学会走路的康复机器人：机器必须托住一条腿，却绝不能与它较劲。

公共道路：感知、规划、行动，循环往复

现在把人的手拿走。自动驾驶车辆没有操作员帮它打方向盘——它必须自己跑完整个循环，每秒钟跑很多遍。这个循环是这个领域里最古老的范式，即感知—规划—行动范式：先建立一幅世界的图景，再决定该做什么，然后行动，然后再看一次。

感知：摄像头、激光雷达与雷达，把车道、车辆和行人变成一幅不断更新的画面。
定位：车必须知道自己在地图上的位置，这件事叫定位——通常是把 GPS 与传感器真正看到的东西融合起来。
规划：在车流中选出一条既守规则又合乎物理的安全路径。
行动：转向、刹车、加速——然后回到感知，因为世界刚刚又变了。

真正的难点不在畅通的高速公路，而在那些没有剧本的瞬间——一个球滚进街道、一名骑行者突然变线、浓雾遮住车道线。道路只能被部分驯服：你可以画清晰的标线，却永远无法给路上的陌生人排班。这正是为什么自动驾驶车比固定在工厂地面上的焊接机械臂，需要多得多的车载判断力。

走向旷野：农田、其他行星与废墟

野外机器人在“脱离人类帮助”这条路上又往前走了一步，因为在这里你连标线都画不了。在农业机器人领域，机器人要在尘土与变化的光照中穿行于作物行间，分辨杂草与幼苗、熟果与生果。没有两块田长得一样，也没有任何东西待在原处，所以机器人必须边走边自建作物行的地图，并对眼前的每一株植物作出判断。

再往外走，帮助会变得更慢。在太空与行星机器人领域，火星车与地球之间隔着数分钟的无线电延迟，人无法实时操控它。等你看到一块石头、发出“停”的指令时，火星车早已压了上去。解决之道是把更多自主性放到车上：火星车自己判断前方地面能否安全通过，自己规划一小段一小段的前进，而人类只在远方设定目标。

最后是最严酷的情形：搜救机器人要钻进坍塌的建筑——那里没有地图、没有 GPS、到处是尘土，而生命正在倒计时。它们必须在一个陌生的地方边画地图、边在地图里找到自己——这正是同时定位与建图（SLAM）那个先有鸡还是先有蛋的把戏。即便在这里，人也仍在回路之中：操作员常常与机器人分担控制，而机器人则处理操作员看不见的每一步落脚。

贯穿始终的那条线

把这些领域排成一行，一个规律就跳了出来。手术让人的双手仍握着操控；汽车拿走了手，却仍行驶在我们仍能部分塑造的道路上；火星车因距离失去了实时帮助；搜救机器人则彻底失去了地图。随着环境一点点脱离我们的掌控，重担便从操作员转移到机器人自己的眼睛和大脑上。

这也是为什么这么多机器被设计成与人协作、而非取代人。手术系统、仓库里的协作机器人、可分担控制的搜救机器人——每一种都把人的判断与机器的稳定配对在一起。机器人的前沿并不是一个没有人的世界；它要解决的，是当脚下的地面不再可预测时，究竟该把多少交到机器人手里。