主力任務:揀選放置循環
走進幾乎任何一座現代工廠或倉庫,你都會看到同一個動作每天重複數百萬次:機器人伸向一個物體,合攏手部,抬起、搬運、再鬆開。這就是揀選放置,工業機器人最基礎的主力任務。一個零件到達已知位置,機器人把它拿起來,再放到別處——放上輸送帶、放進箱子、放到電路板上。這聽起來微不足道,但操作機器人所掌握的幾乎一切都在這裡匯集。
在底層,一次揀選放置循環是一條短小的流水線。機器人首先定位物體——有時靠攝影機,有時靠把零件固定在已知位姿的夾具。接著它規劃一個抓取:在物體何處接觸,以及如何合攏手指使零件不會滑脫。它執行一段預抓取與接近——先把手部移到物體正上方的暫存點,再筆直下降,以免把零件撞歪。最後它合攏夾爪、抬起、沿規劃好的路徑移動,再把零件放下。
伸進雜亂:料箱抓取
現在設想零件不是整齊排列,而是倒進一個料箱——幾十顆相同的螺栓,或一堆混雜的產品,以各種角度相互重疊、彼此纏繞。一次取出一個,這叫料箱抓取,是工業機器人經典的難題之一。機器人不再能假定任何東西的位置。它必須看進這堆雜亂、決定抓哪個物體、在其上找到可抓取的位置,並把它拉出來而不帶動旁邊的零件。
感知承擔了最重的工作。深度相機——一種同時記錄顏色與距離的RGB-D 相機——生成一片點雲,即勾勒出料堆表面的密集三維點集。在此基礎上,現代系統直接提出候選抓取:一個習得的模型為成千上萬種可能的手部放置打分,並挑出最可能成功的那一個。每個候選都要用抓取品質指標檢驗——手指是否真能握住物體,手部是否與料箱壁和其他零件無碰撞?
在這裡,手部的選擇極其關鍵。吸盤夾爪——壓在平面上的真空吸盤——在雜亂中格外寬容:它不需要把物體包住,只要貼住一塊光滑表面即可。這正是眾多倉庫料箱抓取工位用吸盤處理箱子與袋裝貨品的原因。兩指平行夾爪握得更牢、能應付不規則形狀,卻需要在零件兩側張開手指的空間——而緊密的料堆未必能提供這樣的空間。
超越抓起即放:靈巧操作與手內操作
揀選放置與料箱抓取共有一個隱藏的假定:物體一旦被抓住,就在手中凍結不動,直到鬆開。但人類做的事遠為豐富。拿起一支筆,你不假思索就用手指把它轉動、在指間挪移、上下翻轉。這就是靈巧操作——用多指手通過精細而協調的手指接觸來控制物體的運動,而不只是把它夾住。
最尖銳的形式是手內操作:在手中重新調整物體姿態,而完全不把它放下。何必如此?因為你抓住一個物體時的姿態,很少正是你使用它時所需的姿態。你可能從桿部拿起一把螺絲起子,隨後必須把握持位置滑到手柄,才能鎖螺絲。放下再重新抓取既費時又可能失敗;在手內完成則快速而流暢——前提是機器人做得到。
靈巧也模糊了握持與推動之間的界線。有時最聰明的一步根本不是抓取,而是輕推:把一個扁平物體滑到桌沿,好讓手指伸到它下面,或把它靠牆頂立起來。這就是非夾持操作——通過推、轉、滾來控制物體,而非用包覆式的握持。真正的靈巧行為會把抓取與推動流暢地交織在一起。
為何手內重定向如此困難
手內操作之所以極其困難,源於幾個交織在一起的原因。要移動物體,你必須斷開並重建接觸——放開一根手指,讓其餘手指撐住——而你這麼做的瞬間,物體就可能移位、傾斜或掉落。每一處接觸都牽涉摩擦、形變和滾動,都難以精確建模。而多指手又有許多關節需要同時協調。這屬於富接觸操作的領域,成敗取決於指尖處發生的雜亂物理,而非一份乾淨的幾何規劃。
穩定握持依賴的是與一個好抓取相同的理念。手指應當達成力封閉——藉助摩擦,它們能抵抗作用於物體的任何推力或扭轉——並且當接觸點移動時,手部必須不斷重新建立力封閉,使物體始終無法逃脫。在整個過程中,機器人希望握力足以抓牢,卻又不至於壓壞脆弱的零件,這正是力控制及相關的阻抗控制發揮價值之處:它們調節手指按壓的力度,而非只是指令一個位置。
由於接觸物理難以精確建模,近年來的突破性成果來自學習。研究者在一個快速的物理模擬器中訓練控制策略——一種從手部所感知的資訊到它該如何運動各關節的映射——跑出真實世界裡機器人根本負擔不起的數百萬次練習試驗。為了挺過遷移到實體硬體這一跳,他們倚重域隨機化,在模擬中刻意改變摩擦、物體重量與感測器雜訊,使策略不至於過擬合到某個完美的虛擬世界。再加上讓指尖感知滑動的觸覺感測器,機器手才學會了完全在手內旋轉一個立方體或重新擺放一件工具。