真实世界的机器人为何会出错

演示与产品之间的鸿沟

一段爆红的机器人视频，展示机器做着惊人的事——倒咖啡、后空翻、叠衣服。它是真的，也确实令人惊艳。但视频只能证明：在某人精心安排的条件下，机器人完成过一次任务。而产品必须在第一万次时也能完成——在某个寻常的周二，在没有任何工程师见过的厨房里，光线不对、杯子又放错了位置的时候。这道鸿沟——在“做成一次”与“次次做成”之间——正是几乎所有真实世界机器人出错的地方。

诚实地说，机器人技术里的演示是容易的那 80%。困难的 20%——决定一套系统能否量产、是否会害到人、或是否悄悄毁掉公司声誉的那部分——是在没人挑选过的条件下保持可靠。一个 95% 成功率的机器人听起来很棒，直到你想起：一台失败率 5% 的手术机器人，或一辆每一百个转弯就误判一次的自动驾驶车，那是灾难，而不是可以忽略的零头。

边缘情况的长尾

边缘情况，是设计者没有预料到、或难以轻松处理的状况：一只塑料袋被风吹过高速公路、一件手术器械以陌生的方式反光、一个堆得歪斜的托盘。每一种都很罕见。麻烦在于，不同的罕见事件几乎数不胜数，所以加在一起，它们一点也不罕见。这就是长尾——少数机器人能轻松应付的常见情况，加上一条庞大的尾巴，里面尽是各自难得一见、但累加起来却主导着真实风险的反常情况。

为什么罕见的 1% 会占主导？因为那恰恰是机器人数据最少、练习最少的地方。一辆自动驾驶车见过数百万次普通的变道，所以处理得很好。但它几乎没见过驮着床垫的骑车人，或风暴过后歪斜悬挂的红绿灯——而那些正是猜错就会伤到人的时刻。同样的逻辑也适用于遇到破损纸箱的仓储机器人，或遇到长得几乎和作物一模一样的杂草的农业机器人。

你无法事先把每一种边缘情况都列出来——世界产生新情况的速度，比工程师写规则的速度还要快。于是真正的工程问题，从“它能完成任务吗？”转向“当它遇到从未见过的东西时，会如何表现？”一个能优雅地失败的机器人——减速、向人求助、安全停下——远比一个自信地给出错误答案的机器人有价值。

现实落差与脆弱的感知

由于真实世界既昂贵、又学得慢，大量机器人训练都在仿真中进行——机器人可以一夜之间练习数百万次。但仿真器永远只是现实的一幅简化卡通：摩擦是近似的、光照是理想化的、传感器太干净了。一项在仿真里完美运行的技能，搬到真实机器上往往就散了架。这种错配就是现实落差，而弥合它，正是仿真到现实迁移的核心难题。

工程师用一些技巧来对抗落差，比如领域随机化——在仿真中刻意变化颜色、重量与摩擦，让机器人学到一项足够稳健、能挺过现实之凌乱的技能。这有帮助，但永远无法完全弥合落差。更深一层的教训是：机器人作用的并非世界本身，而是它对世界的模型；而每个模型都在某些方面是错的——这些错处，只有在意外恰好压上弱点时才会暴露。

这个模型中最脆弱的部分，通常是感知——机器人如何把摄像头与传感器的数据，转化为对周围环境的理解。感知很脆弱：一套在晴朗白天道路上训练的视觉系统，可能被湿路面反射的眩光致盲、被大雨愚弄，或被训练时从未见过的物体难住。一个无法可靠分辨自己在看什么的机器人，无论电机和数学多么出色，都无法安全地规划与行动。许多著名的失败，并非智能的失败——而是传感器看到的世界，与预期略有不同。

我们如何试图遏制失败——以及规则的局限

既然失败无法消除，机器人这门学科很大程度上就是在遏制失败。三个层次承担了大部分工作：

安全标准。公开、可审计的规则——例如机器人安全标准所涵盖的那些——规定了机器人在人附近可施加多大的力、能以多快的速度移动、何时必须停止。比如一台在人身旁工作的协作机器人，被设计成能感知接触，并在造成伤害之前停下。
测试与验证。在部署之前很久，系统就要面对庞大的录制场景库，以及刻意刁难的情形，以便在实验室里、而非马路上发现失败。自动驾驶项目记录数百万英里的真实与仿真里程，抢在客户之前去搜寻那条长尾。
可解释性。当机器人真的采取行动时，我们越来越希望它能说清为什么——这正是机器人可解释性与信任的目标。如果我们能审视一个决策背后的推理，就能调试失败、厘清责任，并判断到底该不该信任这套系统。

这些层次必不可少，但仅靠规则无法承担全部重量。一项标准可以规定最大作用力，却无法预料机器人将遭遇的每一种情形。一套现代的学习型系统，可能通过一团连建造者都无法完全读懂的数字来做决定，这让真正的可解释性变得极其困难。而风险最高的争论——比如是否该允许致命性自主武器在没有人类参与的情况下选择目标，或如何在效率与自动化与劳动力替代之间权衡——并不是有待修复的程序错误，而是任何测试套件都无法裁决的价值判断。这正是机器人伦理的领域：关乎我们应该造什么，而不只是它能否运转。

诚实的结论：可靠性才是难处

把这一切拼起来，一幅清晰的图景就浮现了。让机器人难以量产的，不是原始能力——而是可靠性。我们能造出一个把惊人之事做成一次的机器人；但要造出一个把寻常之事安全做成、次次做成、并能贯穿真实世界那条凌乱长尾的机器人，则是另一个、也困难得多的问题。下次你看到令人瞠目的机器人演示时，最有用的问题不是“它能做到那个吗？”，而是“当无人观看、世界又拒绝配合时，它能把那件事做上一万次吗？”