JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

走入真实世界的机器人

手术、自动驾驶、农田、太空与灾区——当一切都不再固定时,机器人要怎样才能行动。

为什么“真实世界”才是难点

工厂里的机器人生活在一个被刻意做得很简单的世界里:零件总是出现在同一个位置,光照从不改变,安全围栏把人挡在外面。可一旦走出围栏,一切都会动起来。病人在呼吸,道路上挤满陌生人,泥土今天泥泞、明天干裂。本篇的核心观点很简单:你越无法控制环境,机器人就越要自己携带感知与判断能力。这份随身携带的“聪明”,就是它的自主性

这里有一条很有用的光谱,通常称为自主等级。一端是人通过机器做完所有事;另一端是机器自己做决定。如今大多数真实世界里的机器人都处在中间某处,本篇接下来就沿着这条光谱,从手术室一路走到另一颗行星。

手术室:人手掌控下的精准

我们先从这些杂乱世界里最受控的一个开始。在手术机器人领域,机器人几乎从不独自行动。外科医生坐在操作台前移动双手;机器人则在病人体内复制这些动作,并加以缩放、滤除颤抖,以更高的精度完成。这就是遥操作——人依然是大脑,机器人则是一双更稳、更小的手。缩放很有帮助:手部一厘米的动作可以缩成器械一毫米的动作,于是人手细微的抖动几乎消失不见。

由于器械接触的是活体组织,单纯的位置指令并不够——硬要推到某个精确点,可能会撕裂柔软的部位。因此手术与辅助系统依赖力控制阻抗控制:机器人不只判断“去哪里”,还要判断“用多大力气推”,遇到阻力时会温柔地退让。同样的思路也驱动着帮助中风病人重新学会走路的康复机器人:机器必须托住一条腿,却绝不能与它较劲。

公共道路:感知、规划、行动,循环往复

现在把人的手拿走。自动驾驶车辆没有操作员帮它打方向盘——它必须自己跑完整个循环,每秒钟跑很多遍。这个循环是这个领域里最古老的范式,即感知—规划—行动范式:先建立一幅世界的图景,再决定该做什么,然后行动,然后再看一次。

  1. 感知:摄像头、激光雷达与雷达,把车道、车辆和行人变成一幅不断更新的画面。
  2. 定位:车必须知道自己在地图上的位置,这件事叫定位——通常是把 GPS 与传感器真正看到的东西融合起来。
  3. 规划:在车流中选出一条既守规则又合乎物理的安全路径。
  4. 行动:转向、刹车、加速——然后回到感知,因为世界刚刚又变了。

真正的难点不在畅通的高速公路,而在那些没有剧本的瞬间——一个球滚进街道、一名骑行者突然变线、浓雾遮住车道线。道路只能被部分驯服:你可以画清晰的标线,却永远无法给路上的陌生人排班。这正是为什么自动驾驶车比固定在工厂地面上的焊接机械臂,需要多得多的车载判断力。

走向旷野:农田、其他行星与废墟

野外机器人在“脱离人类帮助”这条路上又往前走了一步,因为在这里你连标线都画不了。在农业机器人领域,机器人要在尘土与变化的光照中穿行于作物行间,分辨杂草与幼苗、熟果与生果。没有两块田长得一样,也没有任何东西待在原处,所以机器人必须边走边自建作物行的地图,并对眼前的每一株植物作出判断。

再往外走,帮助会变得更慢。在太空与行星机器人领域,火星车与地球之间隔着数分钟的无线电延迟,人无法实时操控它。等你看到一块石头、发出“停”的指令时,火星车早已压了上去。解决之道是把更多自主性放到车上:火星车自己判断前方地面能否安全通过,自己规划一小段一小段的前进,而人类只在远方设定目标。

最后是最严酷的情形:搜救机器人要钻进坍塌的建筑——那里没有地图、没有 GPS、到处是尘土,而生命正在倒计时。它们必须在一个陌生的地方边画地图、边在地图里找到自己——这正是同时定位与建图(SLAM)那个先有鸡还是先有蛋的把戏。即便在这里,人也仍在回路之中:操作员常常与机器人分担控制,而机器人则处理操作员看不见的每一步落脚。

贯穿始终的那条线

把这些领域排成一行,一个规律就跳了出来。手术让人的双手仍握着操控;汽车拿走了手,却仍行驶在我们仍能部分塑造的道路上;火星车因距离失去了实时帮助;搜救机器人则彻底失去了地图。随着环境一点点脱离我们的掌控,重担便从操作员转移到机器人自己的眼睛和大脑上。

这也是为什么这么多机器被设计成与人协作、而非取代人。手术系统、仓库里的协作机器人、可分担控制的搜救机器人——每一种都把人的判断与机器的稳定配对在一起。机器人的前沿并不是一个没有人的世界;它要解决的,是当脚下的地面不再可预测时,究竟该把多少交到机器人手里。