真實世界的機器人為何會出錯

示範與產品之間的鴻溝

一段爆紅的機器人影片，展示機器做著驚人的事——倒咖啡、後空翻、摺衣服。它是真的，也確實令人驚艷。但影片只能證明：在某人精心安排的條件下，機器人完成過一次任務。而產品必須在第一萬次時也能完成——在某個尋常的週二，在沒有任何工程師見過的廚房裡，光線不對、杯子又放錯了位置的時候。這道鴻溝——在「做成一次」與「次次做成」之間——正是幾乎所有真實世界機器人出錯的地方。

誠實地說，機器人技術裡的示範是容易的那 80%。困難的 20%——決定一套系統能否量產、是否會害到人、或是否悄悄毀掉公司聲譽的那部分——是在沒人挑選過的條件下保持可靠。一個 95% 成功率的機器人聽起來很棒，直到你想起：一台失敗率 5% 的手術機器人，或一輛每一百個轉彎就誤判一次的自動駕駛車，那是災難，而不是可以忽略的零頭。

邊緣情況的長尾

邊緣情況，是設計者沒有預料到、或難以輕鬆處理的狀況：一隻塑膠袋被風吹過高速公路、一件手術器械以陌生的方式反光、一個堆得歪斜的棧板。每一種都很罕見。麻煩在於，不同的罕見事件幾乎數不勝數，所以加在一起，它們一點也不罕見。這就是長尾——少數機器人能輕鬆應付的常見情況，加上一條龐大的尾巴，裡面盡是各自難得一見、但累加起來卻主導著真實風險的反常情況。

為什麼罕見的 1% 會佔主導？因為那恰恰是機器人資料最少、練習最少的地方。一輛自動駕駛車見過數百萬次普通的變道，所以處理得很好。但它幾乎沒見過馱著床墊的騎車人，或風暴過後歪斜懸掛的紅綠燈——而那些正是猜錯就會傷到人的時刻。同樣的邏輯也適用於遇到破損紙箱的倉儲機器人，或遇到長得幾乎和作物一模一樣的雜草的農業機器人。

你無法事先把每一種邊緣情況都列出來——世界產生新情況的速度，比工程師寫規則的速度還要快。於是真正的工程問題，從「它能完成任務嗎？」轉向「當它遇到從未見過的東西時，會如何表現？」一個能優雅地失敗的機器人——減速、向人求助、安全停下——遠比一個自信地給出錯誤答案的機器人有價值。

現實落差與脆弱的感知

由於真實世界既昂貴、又學得慢，大量機器人訓練都在模擬中進行——機器人可以一夜之間練習數百萬次。但模擬器永遠只是現實的一幅簡化卡通：摩擦是近似的、光照是理想化的、感測器太乾淨了。一項在模擬裡完美運行的技能，搬到真實機器上往往就散了架。這種錯配就是現實落差，而彌合它，正是模擬到現實遷移的核心難題。

工程師用一些技巧來對抗落差，比如領域隨機化——在模擬中刻意變化顏色、重量與摩擦，讓機器人學到一項足夠穩健、能挺過現實之凌亂的技能。這有幫助，但永遠無法完全彌合落差。更深一層的教訓是：機器人作用的並非世界本身，而是它對世界的模型；而每個模型都在某些方面是錯的——這些錯處，只有在意外恰好壓上弱點時才會暴露。

這個模型中最脆弱的部分，通常是感知——機器人如何把攝影機與感測器的資料，轉化為對周圍環境的理解。感知很脆弱：一套在晴朗白天道路上訓練的視覺系統，可能被濕路面反射的眩光致盲、被大雨愚弄，或被訓練時從未見過的物體難住。一個無法可靠分辨自己在看什麼的機器人，無論馬達和數學多麼出色，都無法安全地規劃與行動。許多著名的失敗，並非智慧的失敗——而是感測器看到的世界，與預期略有不同。

我們如何試圖遏制失敗——以及規則的侷限

既然失敗無法消除，機器人這門學科很大程度上就是在遏制失敗。三個層次承擔了大部分工作：

安全標準。公開、可稽核的規則——例如機器人安全標準所涵蓋的那些——規定了機器人在人附近可施加多大的力、能以多快的速度移動、何時必須停止。比如一台在人身旁工作的協作機器人，被設計成能感知接觸，並在造成傷害之前停下。
測試與驗證。在部署之前很久，系統就要面對龐大的錄製場景庫，以及刻意刁難的情形，以便在實驗室裡、而非馬路上發現失敗。自動駕駛專案記錄數百萬英里的真實與模擬里程，搶在客戶之前去搜尋那條長尾。
可解釋性。當機器人真的採取行動時，我們越來越希望它能說清為什麼——這正是機器人可解釋性與信任的目標。如果我們能審視一個決策背後的推理，就能除錯失敗、釐清責任，並判斷到底該不該信任這套系統。

這些層次必不可少，但僅靠規則無法承擔全部重量。一項標準可以規定最大作用力，卻無法預料機器人將遭遇的每一種情形。一套現代的學習型系統，可能透過一團連建造者都無法完全讀懂的數字來做決定，這讓真正的可解釋性變得極其困難。而風險最高的爭論——比如是否該允許致命性自主武器在沒有人類參與的情況下選擇目標，或如何在效率與自動化與勞動力替代之間權衡——並不是有待修復的程式錯誤，而是任何測試套件都無法裁決的價值判斷。這正是機器人倫理的領域：關乎我們應該造什麼，而不只是它能否運轉。

誠實的結論：可靠性才是難處

把這一切拼起來，一幅清晰的圖景就浮現了。讓機器人難以量產的，不是原始能力——而是可靠性。我們能造出一個把驚人之事做成一次的機器人；但要造出一個把尋常之事安全做成、次次做成、並能貫穿真實世界那條凌亂長尾的機器人，則是另一個、也困難得多的問題。下次你看到令人瞠目的機器人示範時，最有用的問題不是「它能做到那個嗎？」，而是「當無人觀看、世界又拒絕配合時，它能把那件事做上一萬次嗎？」