JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

為什麼簡單的事反而難

機器人能輾壓西洋棋,卻綁不好鞋帶;在模擬裡完美的程式碼,到現實世界就抓瞎。兩道著名的鴻溝解釋了原因——以及這門學科如何把它們填上。

莫拉維克悖論:被顛倒的難度表

讓一個人心算 4827 乘以 391,他會冒汗;讓他拿起一隻咖啡杯、穿過堆滿雜物的房間、認出朋友的臉,他想都不用想就做到了。對機器人來說,難度恰好反過來:算術輕而易舉,而那隻杯子、那段路、那張臉卻難如登天。這種顛倒被稱為莫拉維克悖論

為什麼?機器人學家漢斯·莫拉維克把原因歸於演化。那些對我們毫不費力的本事——看、抓、平衡、讀懂一個房間的氣氛——在生物學上是最古老的,被數億年的生存壓力反覆打磨。它們運行在龐大而無聲的神經機器上,從不進入意識,所以才顯得毫不費力。像代數這樣的抽象推理只是薄薄一層近代產物,不過幾千年歷史,於是它又慢又費勁——恰恰因為它太新了。

所以我們引以為傲的那些事——下棋、邏輯、計算——反而最容易自動化,因為它們早已被寫成清晰的規則。而我們從不在意的那些事——摸到襪口的邊緣、腳一滑立刻穩住自己——才是最難的,因為從來沒人寫下規則;演化把它們直接烙進了我們的身體。

現實鴻溝:完美程式碼撞上凌亂的硬體

還有第二道更陰險的鴻溝。你寫好一個控制器,在模擬器裡測試,機器人連續走上一千次都完美無瑕;然後把一模一樣的程式碼裝進真機——它第一步就摔了。這種痛苦的意外有個名字:現實鴻溝

原因簡單卻頑固:模擬器只是一個模型,而沒有任何模型能完美還原現實。關節裡真實的摩擦,永遠不等於你輸入的那個乾淨數字。接觸——腳或指尖觸到東西的那一瞬間——是出了名地難以模擬,充滿細微的打滑與擠壓。感測器還要再添一層雜質:每一次讀數都帶著一點雜訊和漂移。把上百個小小的偏差疊加起來,精心調好的控制器就偏離了劇本。

請注意,莫拉維克悖論和現實鴻溝其實是同一枚硬幣的兩面。它們都在說:物理世界比任何乾淨的規則或模型都更豐富、更凌亂。走路之所以難,和模擬之所以漏,是同一個原因——接觸、摩擦和雜訊無處不在,它們拒絕被完整地寫下來。

六十年來對鴻溝的逐點鑿擊

機器人學的歷史,很大程度上就是一支支團隊逐點鑿擊這兩道鴻溝的故事。而第一步大動作,是乾脆把它們繞開。

  1. 1961 年——Unimate。第一台工業機器人 Unimate 上崗,在通用汽車的生產線上搬運滾燙的壓鑄件。它的訣竅是迴避難題:把它固定住,給它一段寫死的腳本,排除一切意外。沒有視覺,沒有平衡,沒有凌亂的接觸——只是永遠重複同一個精確動作。
  2. 1970 至 90 年代——先感知,再規劃,後行動。當機器人走出固定的籠子,研究者搭建了感知—規劃—行動迴路:讀取世界、算出計畫、移動、再來一遍。它能用,但很慢——每一步都依賴一個關於世界的模型,而現實鴻溝不斷懲罰這些模型裡的漏洞。
  3. 2004 至 2015 年——DARPA 的躍遷。DARPA 挑戰賽讓汽車穿越沙漠,讓人形機器人走過災難場地。它們迫使機器人應對沒有劇本的真實世界——開闊地形、瓦礫、門——這門學科也痛苦地認清了:現實鴻溝到底有多寬。
  4. 2015 年至今——用學習取代寫死腳本。機器人不再靠手寫每一條規則,而是從資料、從數百萬次模擬試驗中學習,再用域隨機化之類的技巧跨越鴻溝。正是這樣,一隻機器狗學會爬過從未見過的瓦礫,一隻機械手學會翻轉一個物件。

每個時代都沒有抹掉這兩道鴻溝,而是把它們收窄了一點。Unimate 迴避它們,感知—規劃—行動正面迎擊它們,DARPA 丈量它們,而基於學習的方法正在慢慢把它們填上——尤其是那些曾經不可能的「簡單」本事,比如在崎嶇地面上行走、穩穩地抓握

啟示:智能存在於身體之中

如果兩道鴻溝都來自同一處——物理世界那未被寫下的豐富性——那麼把它們統一起來的啟示也是同一個觀念:具身智能。真實世界裡的能力,不只是一個大腦向愚笨的身體下達命令。身體、感測器、接觸,甚至四肢的彈性,都在分擔一部分「思考」。一隻靈巧的手讓抓取更容易;有柔順性的腿在任何控制器反應之前,就已經吸收掉一記踉蹌。

這重新定義了整個目標。重點不是造出一個完美的頭腦、然後隨便裝到哪個身體上,而是讓身體與行為共同設計,使物理為你所用、而非與你為敵。這正是為什麼機器人學有那麼大一部分是機械的、物理的,而不只是程式碼——也是為什麼這條學習階梯接下來會把時間花在關節、感測器、接觸和控制上,而不只是抽象推理。