演示与产品之间的鸿沟
一段爆红的机器人视频,展示机器做着惊人的事——倒咖啡、后空翻、叠衣服。它是真的,也确实令人惊艳。但视频只能证明:在某人精心安排的条件下,机器人完成过一次任务。而产品必须在第一万次时也能完成——在某个寻常的周二,在没有任何工程师见过的厨房里,光线不对、杯子又放错了位置的时候。这道鸿沟——在“做成一次”与“次次做成”之间——正是几乎所有真实世界机器人出错的地方。
诚实地说,机器人技术里的演示是容易的那 80%。困难的 20%——决定一套系统能否量产、是否会害到人、或是否悄悄毁掉公司声誉的那部分——是在没人挑选过的条件下保持可靠。一个 95% 成功率的机器人听起来很棒,直到你想起:一台失败率 5% 的手术机器人,或一辆每一百个转弯就误判一次的自动驾驶车,那是灾难,而不是可以忽略的零头。
边缘情况的长尾
边缘情况,是设计者没有预料到、或难以轻松处理的状况:一只塑料袋被风吹过高速公路、一件手术器械以陌生的方式反光、一个堆得歪斜的托盘。每一种都很罕见。麻烦在于,不同的罕见事件几乎数不胜数,所以加在一起,它们一点也不罕见。这就是长尾——少数机器人能轻松应付的常见情况,加上一条庞大的尾巴,里面尽是各自难得一见、但累加起来却主导着真实风险的反常情况。
为什么罕见的 1% 会占主导?因为那恰恰是机器人数据最少、练习最少的地方。一辆自动驾驶车见过数百万次普通的变道,所以处理得很好。但它几乎没见过驮着床垫的骑车人,或风暴过后歪斜悬挂的红绿灯——而那些正是猜错就会伤到人的时刻。同样的逻辑也适用于遇到破损纸箱的仓储机器人,或遇到长得几乎和作物一模一样的杂草的农业机器人。
你无法事先把每一种边缘情况都列出来——世界产生新情况的速度,比工程师写规则的速度还要快。于是真正的工程问题,从“它能完成任务吗?”转向“当它遇到从未见过的东西时,会如何表现?”一个能优雅地失败的机器人——减速、向人求助、安全停下——远比一个自信地给出错误答案的机器人有价值。
现实落差与脆弱的感知
由于真实世界既昂贵、又学得慢,大量机器人训练都在仿真中进行——机器人可以一夜之间练习数百万次。但仿真器永远只是现实的一幅简化卡通:摩擦是近似的、光照是理想化的、传感器太干净了。一项在仿真里完美运行的技能,搬到真实机器上往往就散了架。这种错配就是现实落差,而弥合它,正是仿真到现实迁移的核心难题。
工程师用一些技巧来对抗落差,比如领域随机化——在仿真中刻意变化颜色、重量与摩擦,让机器人学到一项足够稳健、能挺过现实之凌乱的技能。这有帮助,但永远无法完全弥合落差。更深一层的教训是:机器人作用的并非世界本身,而是它对世界的模型;而每个模型都在某些方面是错的——这些错处,只有在意外恰好压上弱点时才会暴露。
这个模型中最脆弱的部分,通常是感知——机器人如何把摄像头与传感器的数据,转化为对周围环境的理解。感知很脆弱:一套在晴朗白天道路上训练的视觉系统,可能被湿路面反射的眩光致盲、被大雨愚弄,或被训练时从未见过的物体难住。一个无法可靠分辨自己在看什么的机器人,无论电机和数学多么出色,都无法安全地规划与行动。许多著名的失败,并非智能的失败——而是传感器看到的世界,与预期略有不同。
我们如何试图遏制失败——以及规则的局限
既然失败无法消除,机器人这门学科很大程度上就是在遏制失败。三个层次承担了大部分工作:
- 安全标准。公开、可审计的规则——例如机器人安全标准所涵盖的那些——规定了机器人在人附近可施加多大的力、能以多快的速度移动、何时必须停止。比如一台在人身旁工作的协作机器人,被设计成能感知接触,并在造成伤害之前停下。
- 测试与验证。在部署之前很久,系统就要面对庞大的录制场景库,以及刻意刁难的情形,以便在实验室里、而非马路上发现失败。自动驾驶项目记录数百万英里的真实与仿真里程,抢在客户之前去搜寻那条长尾。
- 可解释性。当机器人真的采取行动时,我们越来越希望它能说清为什么——这正是机器人可解释性与信任的目标。如果我们能审视一个决策背后的推理,就能调试失败、厘清责任,并判断到底该不该信任这套系统。
这些层次必不可少,但仅靠规则无法承担全部重量。一项标准可以规定最大作用力,却无法预料机器人将遭遇的每一种情形。一套现代的学习型系统,可能通过一团连建造者都无法完全读懂的数字来做决定,这让真正的可解释性变得极其困难。而风险最高的争论——比如是否该允许致命性自主武器在没有人类参与的情况下选择目标,或如何在效率与自动化与劳动力替代之间权衡——并不是有待修复的程序错误,而是任何测试套件都无法裁决的价值判断。这正是机器人伦理的领域:关乎我们应该造什么,而不只是它能否运转。
诚实的结论:可靠性才是难处
把这一切拼起来,一幅清晰的图景就浮现了。让机器人难以量产的,不是原始能力——而是可靠性。我们能造出一个把惊人之事做成一次的机器人;但要造出一个把寻常之事安全做成、次次做成、并能贯穿真实世界那条凌乱长尾的机器人,则是另一个、也困难得多的问题。下次你看到令人瞠目的机器人演示时,最有用的问题不是“它能做到那个吗?”,而是“当无人观看、世界又拒绝配合时,它能把那件事做上一万次吗?”