拿起一只杯子的日常奇迹
伸出手,拿起你的咖啡杯。你做这件事时没有一丝刻意的念头:手在空中就预先摆好了形状,手指落在恰到好处的位置,你用的力气刚好能把它提起来,既不会捏碎,也不会让它滑掉。整套动作只花了大约一秒,而且感觉毫不费力。
对机器人来说,这却是你能交给它的最难的任务之一。一台机器要在国际象棋上击败特级大师,远比它可靠地从水槽里捞起一把湿勺子来得容易。这种难度上的颠倒,以最早注意到它的机器人学家命名:莫拉维克悖论指出,进化花了数百万年打磨的那些能力——看、走、抓——恰恰是对我们毫不费力、对机器却异常艰难的事。
抓取是一组赢得拔河的接触
我们把这个词说精确些。抓取,是手与物体接触的方式,使它能够有意地握住并移动该物体。撇开生物学,一次抓取其实就是一组接触点,以及穿过这些点的力。这些力的任务,是在一场持续的拔河中胜出,对抗一切想把物体往错误方向带的因素——向下拉的重力,以及途中任何的碰撞、倾斜或猛拽。
在机器人上,机械臂末端那个负责接触世界的部件叫做末端执行器——无论任务是什么,它都是真正去完成任务的「干活那一端」。当这个末端执行器是专门为抓握物体而造的,我们就称它为夹爪。夹爪可以简单到只是两片平行钳口的对夹,也可以复杂到像一只多指的手。它就是负责完成抓取的那个部件。
摩擦、接触点,以及恰到好处的夹力
一个物体会以两种方式辜负你:它可能从你的握持中滑脱,也可能在仍保持接触的情况下扭转、旋转。一次稳固的抓取必须同时制止这两者。能否做到,取决于三件事。
- 摩擦是握持的秘密盟友。指尖与表面之间的粗糙,让一个横向的夹捏得以抵抗向下的拉力——这与机器人关节处研究的力是同一种,关节摩擦,只是这一次它在接触面上为你效力。橡胶指尖按在干燥的杯子上摩擦很大;钢制钳口夹在湿玻璃上则几乎没有,这正是滑溜的物体如此棘手的原因。
- 接触点落在哪里,和有多少个接触点同样重要。两根手指压在物体正相对的两侧、笔直地相向用力,是最干净利落的对夹——它如此常见又如此有用,以至于有了自己的名字:对向抓取。接触点摆得不好,再有力的手指也会让物体绕着轴心溜走。
- 夹力必须「不多不少」:要足够大,让摩擦能发挥作用;又不能太大,以免捏碎一颗鸡蛋或压瘪一只纸杯。人类靠触觉来解决这个问题;机器人则越来越多地在指尖装上触觉传感器,去感知滑动的最初一丝迹象,恰好及时地收紧。
机器人学家有两种正式的说法,来表示一次抓取是真的握住了。一种依靠摩擦和夹紧:只要手指压得够紧,摩擦就能抵消任何扰动——这叫力闭合。另一种则不依赖摩擦,纯粹靠形状把物体困住,就像一根销钉严丝合缝地嵌进配套的孔里、动弹不得——这叫形闭合。日常的机器人抓取大多依赖前者;后者更牢靠,但更难安排。
这条学习线接下来去哪里
既然「抓取」已经有了真切的定义,这条学习线接下来会把它的每一个部分,都变成一个机器人可以付诸行动的问题。
- 决定从哪里抓。给定一个形状,哪些接触点能形成稳定的握持?这就是抓取规划,我们会用抓取质量度量来评判各个候选方案——一个衡量抓取有多稳健的分数。
- 选择用哪只手。对夹的钳口、用于灵巧操作的多指手,或者只靠真空吸盘贴上去的吸盘夹爪——各自适合不同的物体与任务。
- 把它派上用场,再去应对未知。最经典的任务是抓取与放置;它更杂乱的「表亲」则是料箱拣选——从一堆乱七八糟的东西里抓出一件。而由于世界从来不会完全如预期,我们会专门用一章来讲不确定性下的操作——有时甚至根本不去抓,只是把物体推到位,这叫非抓握式操作。
贯穿这一切的主线是:抓取不是单一的技巧,而是一个紧密的循环——感知、决定、感受——正是具身智能所刻画的那种身体与大脑的协作。继续往下学时,请把那只咖啡杯记在心里;后面每一个概念,都不过是对你自己的手在一秒内解答过的那个问题,给出的一份审慎答案。