一個含義太多的詞
一說「人工智慧」,每個人腦子裡浮現的都不一樣:替你寫郵件的聊天機器人、會自己開的汽車、科幻片裡密謀對付人類的機器、能認出你臉的手機。它們不可能是同一樣東西——可我們偏偏都用同一個詞。所以在動任何數學之前,得先把問題問得更準:人工智慧到底想做什麼,它又和早已遍佈你身邊的普通軟體差在哪?
作為一門學科,人工智慧的目標簡單而宏大:造出能做那些「人來做就算聰明」的事情的機器——認人臉、讀懂句子、規劃路線、從錯誤中學習。這門學科是在 1956 年一次夏季會議(達特茅斯研討會)上被命名的,幾位研究者在那裡提出:「學習或智慧的每一個方面,原則上都能被精確描述到可以讓機器去模擬它。」這個大膽的賭注,就是整場冒險的開端。它是否完全成立至今仍無定論——但它已經帶我們走出了驚人的一程。
人工智慧和普通軟體差在哪
普通軟體遵循的是人事先寫好的規則。「如果購物車總額超過 50 美元,就減 5 美元」——這條規則是人定的、敲進去的,電腦便永遠一絲不差地照辦。當規則可以被寫清楚時,這非常好用。可你要怎麼為「這張照片裡是貓嗎?」寫規則?一試就會陷進去:貓有上千種毛色、姿勢、光線和品種,還可能半藏在傢俱後面。沒有人能把每一種情況都事先一一列出。
現代人工智慧裡最深的那股暗流,把這件事整個倒了過來。你不去寫規則,而是給機器看成千上萬個例子——已經標好「是貓」或「不是貓」的照片——讓它自己找出其中的規律。這就是機器學習:程式不被告知規則,而是從資料裡學出規則。這一轉看似微小,實則深刻——我們從「編寫答案」走向了「編寫發現答案的方法」。
三個嵌套的圓圈:AI、機器學習、深度學習
人們最容易混淆的這三個詞,用「圓圈套圓圈」來想像最清楚。人工智慧是最外層的大圓:一切讓機器表現得聰明的技術,規則也好、學習也好,都算。它裡面套著機器學習:從資料中學習、而非手工編程的那個子集。再裡面套著深度學習:用神經網路來做的機器學習,這種網路層層堆疊,靈感大致來自大腦裡神經元彼此連線的方式。
所以一切深度學習都是機器學習,一切機器學習都是人工智慧——但反過來不成立。一台用蠻力窮舉著法的西洋棋引擎是人工智慧,卻不是機器學習。一個從帶標籤郵件裡學習的簡單垃圾郵件過濾器是機器學習,卻不是深度學習。而人人都在談的聊天機器人——建立在一類大語言模型之上——屬於深度學習,最裡面那一圈。把這幾個圓圈分清楚,能讓你看懂一大堆原本一頭霧水的新聞標題。
Artificial Intelligence (make machines act smart)
└─ Machine Learning (learn the rules from data)
└─ Deep Learning (learn with many-layered neural networks)
examples:
chess by brute-force search ... AI only
spam filter from examples ..... AI + ML
image / language models ....... AI + ML + Deep Learning這層嵌套也講出了一段歷史。早期人工智慧倚重符號規則與搜尋;從資料中學習的那一派,叫作聯結主義,曾被冷落多年,甚至熬過了幾次因為承諾遠超成果而導致的資金寒冬,史稱人工智慧寒冬。直到高速電腦和海量資料到來,深度學習才一躍居於中心。許多人從中得到的教訓——能隨算力擴展的通用方法,往往最終勝過手工打造的巧思——甚至有個專門的名字:苦澀的教訓。
窄與廣:一招鮮,還是樣樣通?
接下來這條區分,是讓你保持期待誠實的最重要的一條。你這輩子遇到的幾乎每一個人工智慧,都是窄人工智慧:在某件具體的事上出神入化,出了那件事就一籌莫展。一個把西洋棋大師殺得片甲不留的程式,繫不好一根鞋帶、聊不了天,連跳棋都不會下。一個能在影像裡揪出腫瘤的醫學模型,根本不知道腫瘤是什麼、病人是什麼,也不知道在它那條窄道之外還存在任何東西。窄,不等於弱——這些系統在它那一件事上往往遠超人類。它們只是沒法靠自己把這身本事遷移到任何新東西上。
與之相對的是通用人工智慧(AGI):一種假想的機器,能像人一樣在任何領域學習和推理,撿起一項它當初根本沒被設計來做的新技能。它並不存在。今天的聊天機器人之所以讓人覺得「通用」,是因為它幾乎什麼都能聊,但底下它其實只是在把一件很窄的事做得極好——預測聽起來合理的下一個詞——而不是像你那樣理解世界。那種靈活的感覺是真實而有用的;把它誤當成真正的通用理解,才是當下最常見的過度宣稱。
這裡的「智慧」到底指什麼?
哲學家們為「智慧」爭論了千百年,所以人工智慧多半繞開這個問題,改用一個可操作的檢驗:別管裡面究竟在發生什麼——這台機器能不能拿出我們會稱之為聰明的行為?1950 年,艾倫·圖靈提出的正是這一點。他的圖靈測試問的不是「機器能思考嗎?」,而是「它能不能聊得好到讓人分不出對面是機器還是人?」憑行為判斷,而不是憑某種我們無從測量的內在火花。
許多從業者採用的一個好用視角,是智慧體觀:智慧系統就是任何能感知自己所處狀況、並為達成某個目標而行動的東西。按這把尺子,恆溫器是一個(極其遲鈍的)智慧體,自動駕駛汽車則是一個精巧的智慧體。「智慧」於是變成一個旋鈕——一個智慧體能在多少種情況下、把目標達成得多好——而不是一枚「是/否」的徽章。這種刻意的謙遜,正是這門學科能不斷推進、而不是卡在定義上的一大原因。
你早已遇見的人工智慧——以及它的邊界
人工智慧早已不是稀罕物,它靜悄悄地穿過你的一天。替你整理收件匣的垃圾郵件過濾器,是從數百萬封帶標籤的郵件裡學出來的——這叫監督學習,從附帶正確答案的例子裡學習。地圖給你挑的路線、手機按人臉把照片歸堆、播放器替你排好的下一首歌、替你把句子補完的自動補全——每一個都是為某一件事訓練出來的窄模型。最近最顯眼的那張面孔是聊天機器人,它由一個基礎模型驅動,先在浩瀚的文本上訓練,再被調適到許多任務上。
那些里程碑式的勝利,套的也是同一個模式。深藍在 1997 年戰勝西洋棋世界冠軍,主要靠的是計算數以百萬計的棋局——更接近蠻力,而非學習。二十年後,阿爾法圍棋攻克了圍棋這個龐大到無法窮舉的遊戲,靠的是從棋譜中學、又跟自己對弈著學。兩者都令人驚嘆——也都很窄:除了那一種棋,它們什麼都做不了。這道橫在「炫目的專才本領」與「零通用能力」之間的鴻溝,正是今天所有人工智慧的標誌。
那就以一本誠實的帳收尾。今天的人工智慧在識別模式、生成流暢的文字與圖像、以及在定義清楚的目標內做最佳化這幾件事上,確實帶來了變革。它同時也很脆:剛一走出訓練範圍,它就可能以幼稚的方式出錯;它沒有常識,也不懂因果;語言模型還會家常便飯般地產生幻覺——自信、流暢、卻乾脆是錯的陳述。這條階梯接下來會一層層搭起這些系統底下真正的機器,好讓你分得清哪是真本事、哪是炒作——而這兩樣,都不少。