示範與產品之間的鴻溝
一段爆紅的機器人影片,展示機器做著驚人的事——倒咖啡、後空翻、摺衣服。它是真的,也確實令人驚艷。但影片只能證明:在某人精心安排的條件下,機器人完成過一次任務。而產品必須在第一萬次時也能完成——在某個尋常的週二,在沒有任何工程師見過的廚房裡,光線不對、杯子又放錯了位置的時候。這道鴻溝——在「做成一次」與「次次做成」之間——正是幾乎所有真實世界機器人出錯的地方。
誠實地說,機器人技術裡的示範是容易的那 80%。困難的 20%——決定一套系統能否量產、是否會害到人、或是否悄悄毀掉公司聲譽的那部分——是在沒人挑選過的條件下保持可靠。一個 95% 成功率的機器人聽起來很棒,直到你想起:一台失敗率 5% 的手術機器人,或一輛每一百個轉彎就誤判一次的自動駕駛車,那是災難,而不是可以忽略的零頭。
邊緣情況的長尾
邊緣情況,是設計者沒有預料到、或難以輕鬆處理的狀況:一隻塑膠袋被風吹過高速公路、一件手術器械以陌生的方式反光、一個堆得歪斜的棧板。每一種都很罕見。麻煩在於,不同的罕見事件幾乎數不勝數,所以加在一起,它們一點也不罕見。這就是長尾——少數機器人能輕鬆應付的常見情況,加上一條龐大的尾巴,裡面盡是各自難得一見、但累加起來卻主導著真實風險的反常情況。
為什麼罕見的 1% 會佔主導?因為那恰恰是機器人資料最少、練習最少的地方。一輛自動駕駛車見過數百萬次普通的變道,所以處理得很好。但它幾乎沒見過馱著床墊的騎車人,或風暴過後歪斜懸掛的紅綠燈——而那些正是猜錯就會傷到人的時刻。同樣的邏輯也適用於遇到破損紙箱的倉儲機器人,或遇到長得幾乎和作物一模一樣的雜草的農業機器人。
你無法事先把每一種邊緣情況都列出來——世界產生新情況的速度,比工程師寫規則的速度還要快。於是真正的工程問題,從「它能完成任務嗎?」轉向「當它遇到從未見過的東西時,會如何表現?」一個能優雅地失敗的機器人——減速、向人求助、安全停下——遠比一個自信地給出錯誤答案的機器人有價值。
現實落差與脆弱的感知
由於真實世界既昂貴、又學得慢,大量機器人訓練都在模擬中進行——機器人可以一夜之間練習數百萬次。但模擬器永遠只是現實的一幅簡化卡通:摩擦是近似的、光照是理想化的、感測器太乾淨了。一項在模擬裡完美運行的技能,搬到真實機器上往往就散了架。這種錯配就是現實落差,而彌合它,正是模擬到現實遷移的核心難題。
工程師用一些技巧來對抗落差,比如領域隨機化——在模擬中刻意變化顏色、重量與摩擦,讓機器人學到一項足夠穩健、能挺過現實之凌亂的技能。這有幫助,但永遠無法完全彌合落差。更深一層的教訓是:機器人作用的並非世界本身,而是它對世界的模型;而每個模型都在某些方面是錯的——這些錯處,只有在意外恰好壓上弱點時才會暴露。
這個模型中最脆弱的部分,通常是感知——機器人如何把攝影機與感測器的資料,轉化為對周圍環境的理解。感知很脆弱:一套在晴朗白天道路上訓練的視覺系統,可能被濕路面反射的眩光致盲、被大雨愚弄,或被訓練時從未見過的物體難住。一個無法可靠分辨自己在看什麼的機器人,無論馬達和數學多麼出色,都無法安全地規劃與行動。許多著名的失敗,並非智慧的失敗——而是感測器看到的世界,與預期略有不同。
我們如何試圖遏制失敗——以及規則的侷限
既然失敗無法消除,機器人這門學科很大程度上就是在遏制失敗。三個層次承擔了大部分工作:
- 安全標準。公開、可稽核的規則——例如機器人安全標準所涵蓋的那些——規定了機器人在人附近可施加多大的力、能以多快的速度移動、何時必須停止。比如一台在人身旁工作的協作機器人,被設計成能感知接觸,並在造成傷害之前停下。
- 測試與驗證。在部署之前很久,系統就要面對龐大的錄製場景庫,以及刻意刁難的情形,以便在實驗室裡、而非馬路上發現失敗。自動駕駛專案記錄數百萬英里的真實與模擬里程,搶在客戶之前去搜尋那條長尾。
- 可解釋性。當機器人真的採取行動時,我們越來越希望它能說清為什麼——這正是機器人可解釋性與信任的目標。如果我們能審視一個決策背後的推理,就能除錯失敗、釐清責任,並判斷到底該不該信任這套系統。
這些層次必不可少,但僅靠規則無法承擔全部重量。一項標準可以規定最大作用力,卻無法預料機器人將遭遇的每一種情形。一套現代的學習型系統,可能透過一團連建造者都無法完全讀懂的數字來做決定,這讓真正的可解釋性變得極其困難。而風險最高的爭論——比如是否該允許致命性自主武器在沒有人類參與的情況下選擇目標,或如何在效率與自動化與勞動力替代之間權衡——並不是有待修復的程式錯誤,而是任何測試套件都無法裁決的價值判斷。這正是機器人倫理的領域:關乎我們應該造什麼,而不只是它能否運轉。
誠實的結論:可靠性才是難處
把這一切拼起來,一幅清晰的圖景就浮現了。讓機器人難以量產的,不是原始能力——而是可靠性。我們能造出一個把驚人之事做成一次的機器人;但要造出一個把尋常之事安全做成、次次做成、並能貫穿真實世界那條凌亂長尾的機器人,則是另一個、也困難得多的問題。下次你看到令人瞠目的機器人示範時,最有用的問題不是「它能做到那個嗎?」,而是「當無人觀看、世界又拒絕配合時,它能把那件事做上一萬次嗎?」