什麼是人工智慧？

一個含義太多的詞

一說「人工智慧」，每個人腦子裡浮現的都不一樣：替你寫郵件的聊天機器人、會自己開的汽車、科幻片裡密謀對付人類的機器、能認出你臉的手機。它們不可能是同一樣東西——可我們偏偏都用同一個詞。所以在動任何數學之前，得先把問題問得更準：人工智慧到底想做什麼，它又和早已遍佈你身邊的普通軟體差在哪？

作為一門學科，人工智慧的目標簡單而宏大：造出能做那些「人來做就算聰明」的事情的機器——認人臉、讀懂句子、規劃路線、從錯誤中學習。這門學科是在 1956 年一次夏季會議（達特茅斯研討會）上被命名的，幾位研究者在那裡提出：「學習或智慧的每一個方面，原則上都能被精確描述到可以讓機器去模擬它。」這個大膽的賭注，就是整場冒險的開端。它是否完全成立至今仍無定論——但它已經帶我們走出了驚人的一程。

人工智慧和普通軟體差在哪

普通軟體遵循的是人事先寫好的規則。「如果購物車總額超過 50 美元，就減 5 美元」——這條規則是人定的、敲進去的，電腦便永遠一絲不差地照辦。當規則可以被寫清楚時，這非常好用。可你要怎麼為「這張照片裡是貓嗎？」寫規則？一試就會陷進去：貓有上千種毛色、姿勢、光線和品種，還可能半藏在傢俱後面。沒有人能把每一種情況都事先一一列出。

現代人工智慧裡最深的那股暗流，把這件事整個倒了過來。你不去寫規則，而是給機器看成千上萬個例子——已經標好「是貓」或「不是貓」的照片——讓它自己找出其中的規律。這就是機器學習：程式不被告知規則，而是從資料裡學出規則。這一轉看似微小，實則深刻——我們從「編寫答案」走向了「編寫發現答案的方法」。

三個嵌套的圓圈：AI、機器學習、深度學習

人們最容易混淆的這三個詞，用「圓圈套圓圈」來想像最清楚。人工智慧是最外層的大圓：一切讓機器表現得聰明的技術，規則也好、學習也好，都算。它裡面套著機器學習：從資料中學習、而非手工編程的那個子集。再裡面套著深度學習：用神經網路來做的機器學習，這種網路層層堆疊，靈感大致來自大腦裡神經元彼此連線的方式。

所以一切深度學習都是機器學習，一切機器學習都是人工智慧——但反過來不成立。一台用蠻力窮舉著法的西洋棋引擎是人工智慧，卻不是機器學習。一個從帶標籤郵件裡學習的簡單垃圾郵件過濾器是機器學習，卻不是深度學習。而人人都在談的聊天機器人——建立在一類大語言模型之上——屬於深度學習，最裡面那一圈。把這幾個圓圈分清楚，能讓你看懂一大堆原本一頭霧水的新聞標題。

Artificial Intelligence   (make machines act smart)
  └─ Machine Learning       (learn the rules from data)
       └─ Deep Learning      (learn with many-layered neural networks)

  examples:
    chess by brute-force search ... AI only
    spam filter from examples ..... AI + ML
    image / language models ....... AI + ML + Deep Learning

每個詞都被裝在它上面那個詞裡——是更窄，而不是另起一攤。

這層嵌套也講出了一段歷史。早期人工智慧倚重符號規則與搜尋；從資料中學習的那一派，叫作聯結主義，曾被冷落多年，甚至熬過了幾次因為承諾遠超成果而導致的資金寒冬，史稱人工智慧寒冬。直到高速電腦和海量資料到來，深度學習才一躍居於中心。許多人從中得到的教訓——能隨算力擴展的通用方法，往往最終勝過手工打造的巧思——甚至有個專門的名字：苦澀的教訓。

窄與廣：一招鮮，還是樣樣通？

接下來這條區分，是讓你保持期待誠實的最重要的一條。你這輩子遇到的幾乎每一個人工智慧，都是窄人工智慧：在某件具體的事上出神入化，出了那件事就一籌莫展。一個把西洋棋大師殺得片甲不留的程式，繫不好一根鞋帶、聊不了天，連跳棋都不會下。一個能在影像裡揪出腫瘤的醫學模型，根本不知道腫瘤是什麼、病人是什麼，也不知道在它那條窄道之外還存在任何東西。窄，不等於弱——這些系統在它那一件事上往往遠超人類。它們只是沒法靠自己把這身本事遷移到任何新東西上。

與之相對的是通用人工智慧（AGI）：一種假想的機器，能像人一樣在任何領域學習和推理，撿起一項它當初根本沒被設計來做的新技能。它並不存在。今天的聊天機器人之所以讓人覺得「通用」，是因為它幾乎什麼都能聊，但底下它其實只是在把一件很窄的事做得極好——預測聽起來合理的下一個詞——而不是像你那樣理解世界。那種靈活的感覺是真實而有用的；把它誤當成真正的通用理解，才是當下最常見的過度宣稱。

這裡的「智慧」到底指什麼？

哲學家們為「智慧」爭論了千百年，所以人工智慧多半繞開這個問題，改用一個可操作的檢驗：別管裡面究竟在發生什麼——這台機器能不能拿出我們會稱之為聰明的行為？1950 年，艾倫·圖靈提出的正是這一點。他的圖靈測試問的不是「機器能思考嗎？」，而是「它能不能聊得好到讓人分不出對面是機器還是人？」憑行為判斷，而不是憑某種我們無從測量的內在火花。

許多從業者採用的一個好用視角，是智慧體觀：智慧系統就是任何能感知自己所處狀況、並為達成某個目標而行動的東西。按這把尺子，恆溫器是一個（極其遲鈍的）智慧體，自動駕駛汽車則是一個精巧的智慧體。「智慧」於是變成一個旋鈕——一個智慧體能在多少種情況下、把目標達成得多好——而不是一枚「是/否」的徽章。這種刻意的謙遜，正是這門學科能不斷推進、而不是卡在定義上的一大原因。

你早已遇見的人工智慧——以及它的邊界

人工智慧早已不是稀罕物，它靜悄悄地穿過你的一天。替你整理收件匣的垃圾郵件過濾器，是從數百萬封帶標籤的郵件裡學出來的——這叫監督學習，從附帶正確答案的例子裡學習。地圖給你挑的路線、手機按人臉把照片歸堆、播放器替你排好的下一首歌、替你把句子補完的自動補全——每一個都是為某一件事訓練出來的窄模型。最近最顯眼的那張面孔是聊天機器人，它由一個基礎模型驅動，先在浩瀚的文本上訓練，再被調適到許多任務上。

那些里程碑式的勝利，套的也是同一個模式。深藍在 1997 年戰勝西洋棋世界冠軍，主要靠的是計算數以百萬計的棋局——更接近蠻力，而非學習。二十年後，阿爾法圍棋攻克了圍棋這個龐大到無法窮舉的遊戲，靠的是從棋譜中學、又跟自己對弈著學。兩者都令人驚嘆——也都很窄：除了那一種棋，它們什麼都做不了。這道橫在「炫目的專才本領」與「零通用能力」之間的鴻溝，正是今天所有人工智慧的標誌。

那就以一本誠實的帳收尾。今天的人工智慧在識別模式、生成流暢的文字與圖像、以及在定義清楚的目標內做最佳化這幾件事上，確實帶來了變革。它同時也很脆：剛一走出訓練範圍，它就可能以幼稚的方式出錯；它沒有常識，也不懂因果；語言模型還會家常便飯般地產生幻覺——自信、流暢、卻乾脆是錯的陳述。這條階梯接下來會一層層搭起這些系統底下真正的機器，好讓你分得清哪是真本事、哪是炒作——而這兩樣，都不少。