什么是人工智能？

一个含义太多的词

一说「人工智能」，每个人脑子里浮现的都不一样：替你写邮件的聊天机器人、会自己开的汽车、科幻片里密谋对付人类的机器、能认出你脸的手机。它们不可能是同一样东西——可我们偏偏都用同一个词。所以在动任何数学之前，得先把问题问得更准：人工智能到底想做什么，它又和早已遍布你身边的普通软件差在哪？

作为一门学科，人工智能的目标简单而宏大：造出能做那些「人来做就算聪明」的事情的机器——认人脸、读懂句子、规划路线、从错误中学习。这门学科是在 1956 年一次夏季会议（达特茅斯研讨会）上被命名的，几位研究者在那里提出：「学习或智能的每一个方面，原则上都能被精确描述到可以让机器去模拟它。」这个大胆的赌注，就是整场冒险的开端。它是否完全成立至今仍无定论——但它已经带我们走出了惊人的一程。

人工智能和普通软件差在哪

普通软件遵循的是人事先写好的规则。「如果购物车总额超过 50 美元，就减 5 美元」——这条规则是人定的、敲进去的，计算机便永远一丝不差地照办。当规则可以被写清楚时，这非常好用。可你要怎么为「这张照片里是猫吗？」写规则？一试就会陷进去：猫有上千种毛色、姿势、光线和品种，还可能半藏在家具后面。没有人能把每一种情况都事先一一列出。

现代人工智能里最深的那股暗流，把这件事整个倒了过来。你不去写规则，而是给机器看成千上万个例子——已经标好「是猫」或「不是猫」的照片——让它自己找出其中的规律。这就是机器学习：程序不被告知规则，而是从数据里学出规则。这一转看似微小，实则深刻——我们从「编写答案」走向了「编写发现答案的方法」。

三个嵌套的圆圈：AI、机器学习、深度学习

人们最容易混淆的这三个词，用「圆圈套圆圈」来想象最清楚。人工智能是最外层的大圆：一切让机器表现得聪明的技术，规则也好、学习也好，都算。它里面套着机器学习：从数据中学习、而非手工编程的那个子集。再里面套着深度学习：用神经网络来做的机器学习，这种网络层层堆叠，灵感大致来自大脑里神经元彼此连线的方式。

所以一切深度学习都是机器学习，一切机器学习都是人工智能——但反过来不成立。一台用蛮力穷举着法的国际象棋引擎是人工智能，却不是机器学习。一个从带标签邮件里学习的简单垃圾邮件过滤器是机器学习，却不是深度学习。而人人都在谈的聊天机器人——建立在一类大语言模型之上——属于深度学习，最里面那一圈。把这几个圆圈分清楚，能让你看懂一大堆原本一头雾水的新闻标题。

Artificial Intelligence   (make machines act smart)
  └─ Machine Learning       (learn the rules from data)
       └─ Deep Learning      (learn with many-layered neural networks)

  examples:
    chess by brute-force search ... AI only
    spam filter from examples ..... AI + ML
    image / language models ....... AI + ML + Deep Learning

每个词都被装在它上面那个词里——是更窄，而不是另起一摊。

这层嵌套也讲出了一段历史。早期人工智能倚重符号规则与搜索；从数据中学习的那一派，叫作联结主义，曾被冷落多年，甚至熬过了几次因为承诺远超成果而导致的资金寒冬，史称人工智能寒冬。直到高速计算机和海量数据到来，深度学习才一跃居于中心。许多人从中得到的教训——能随算力扩展的通用方法，往往最终胜过手工打造的巧思——甚至有个专门的名字：苦涩的教训。

窄与广：一招鲜，还是样样通？

接下来这条区分，是让你保持期待诚实的最重要的一条。你这辈子遇到的几乎每一个人工智能，都是窄人工智能：在某件具体的事上出神入化，出了那件事就一筹莫展。一个把国际象棋大师杀得片甲不留的程序，系不好一根鞋带、聊不了天，连跳棋都不会下。一个能在影像里揪出肿瘤的医学模型，根本不知道肿瘤是什么、病人是什么，也不知道在它那条窄道之外还存在任何东西。窄，不等于弱——这些系统在它那一件事上往往远超人类。它们只是没法靠自己把这身本事迁移到任何新东西上。

与之相对的是通用人工智能（AGI）：一种假想的机器，能像人一样在任何领域学习和推理，捡起一项它当初根本没被设计来做的新技能。它并不存在。今天的聊天机器人之所以让人觉得「通用」，是因为它几乎什么都能聊，但底下它其实只是在把一件很窄的事做得极好——预测听起来合理的下一个词——而不是像你那样理解世界。那种灵活的感觉是真实而有用的；把它误当成真正的通用理解，才是当下最常见的过度宣称。

这里的「智能」到底指什么？

哲学家们为「智能」争论了千百年，所以人工智能多半绕开这个问题，改用一个可操作的检验：别管里面究竟在发生什么——这台机器能不能拿出我们会称之为聪明的行为？1950 年，阿兰·图灵提出的正是这一点。他的图灵测试问的不是「机器能思考吗？」，而是「它能不能聊得好到让人分不出对面是机器还是人？」凭行为判断，而不是凭某种我们无从测量的内在火花。

许多从业者采用的一个好用视角，是智能体观：智能系统就是任何能感知自己所处状况、并为达成某个目标而行动的东西。按这把尺子，恒温器是一个（极其迟钝的）智能体，自动驾驶汽车则是一个精巧的智能体。「智能」于是变成一个旋钮——一个智能体能在多少种情况下、把目标达成得多好——而不是一枚「是/否」的徽章。这种刻意的谦逊，正是这门学科能不断推进、而不是卡在定义上的一大原因。

你早已遇见的人工智能——以及它的边界

人工智能早已不是稀罕物，它静悄悄地穿过你的一天。替你整理收件箱的垃圾邮件过滤器，是从数百万封带标签的邮件里学出来的——这叫监督学习，从附带正确答案的例子里学习。地图给你挑的路线、手机按人脸把照片归堆、播放器替你排好的下一首歌、替你把句子补完的自动补全——每一个都是为某一件事训练出来的窄模型。最近最显眼的那张面孔是聊天机器人，它由一个基础模型驱动，先在浩瀚的文本上训练，再被调适到许多任务上。

那些里程碑式的胜利，套的也是同一个模式。深蓝在 1997 年战胜国际象棋世界冠军，主要靠的是计算数以百万计的棋局——更接近蛮力，而非学习。二十年后，阿尔法围棋攻克了围棋这个庞大到无法穷举的游戏，靠的是从棋谱中学、又跟自己对弈着学。两者都令人惊叹——也都很窄：除了那一种棋，它们什么都做不了。这道横在「炫目的专才本领」与「零通用能力」之间的鸿沟，正是今天所有人工智能的标志。

那就以一本诚实的账收尾。今天的人工智能在识别模式、生成流畅的文字与图像、以及在定义清楚的目标内做优化这几件事上，确实带来了变革。它同时也很脆：刚一走出训练范围，它就可能以幼稚的方式出错；它没有常识，也不懂因果；语言模型还会家常便饭般地产生幻觉——自信、流畅、却干脆是错的陈述。这条阶梯接下来会一层层搭起这些系统底下真正的机器，好让你分得清哪是真本事、哪是炒作——而这两样，都不少。