JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

什么是人工智能?

在钻进数学和模型之前,先看全局:人工智能到底是什么、它和普通软件差在哪、人工智能/机器学习/深度学习之间层层嵌套的关系,以及对今天的系统能做什么、不能做什么的一次诚实审视。

一个含义太多的词

一说「人工智能」,每个人脑子里浮现的都不一样:替你写邮件的聊天机器人、会自己开的汽车、科幻片里密谋对付人类的机器、能认出你脸的手机。它们不可能是同一样东西——可我们偏偏都用同一个词。所以在动任何数学之前,得先把问题问得更准:人工智能到底想做什么,它又和早已遍布你身边的普通软件差在哪?

作为一门学科,人工智能的目标简单而宏大:造出能做那些「人来做就算聪明」的事情的机器——认人脸、读懂句子、规划路线、从错误中学习。这门学科是在 1956 年一次夏季会议(达特茅斯研讨会)上被命名的,几位研究者在那里提出:「学习或智能的每一个方面,原则上都能被精确描述到可以让机器去模拟它。」这个大胆的赌注,就是整场冒险的开端。它是否完全成立至今仍无定论——但它已经带我们走出了惊人的一程。

人工智能和普通软件差在哪

普通软件遵循的是人事先写好的规则。「如果购物车总额超过 50 美元,就减 5 美元」——这条规则是人定的、敲进去的,计算机便永远一丝不差地照办。当规则可以被写清楚时,这非常好用。可你要怎么为「这张照片里是猫吗?」写规则?一试就会陷进去:猫有上千种毛色、姿势、光线和品种,还可能半藏在家具后面。没有人能把每一种情况都事先一一列出。

现代人工智能里最深的那股暗流,把这件事整个倒了过来。你不去写规则,而是给机器看成千上万个例子——已经标好「是猫」或「不是猫」的照片——让它自己找出其中的规律。这就是机器学习:程序不被告知规则,而是从数据里学出规则。这一转看似微小,实则深刻——我们从「编写答案」走向了「编写发现答案的方法」。

三个嵌套的圆圈:AI、机器学习、深度学习

人们最容易混淆的这三个词,用「圆圈套圆圈」来想象最清楚。人工智能是最外层的大圆:一切让机器表现得聪明的技术,规则也好、学习也好,都算。它里面套着机器学习:从数据中学习、而非手工编程的那个子集。再里面套着深度学习:用神经网络来做的机器学习,这种网络层层堆叠,灵感大致来自大脑里神经元彼此连线的方式。

所以一切深度学习都是机器学习,一切机器学习都是人工智能——但反过来不成立。一台用蛮力穷举着法的国际象棋引擎是人工智能,却不是机器学习。一个从带标签邮件里学习的简单垃圾邮件过滤器是机器学习,却不是深度学习。而人人都在谈的聊天机器人——建立在一类大语言模型之上——属于深度学习,最里面那一圈。把这几个圆圈分清楚,能让你看懂一大堆原本一头雾水的新闻标题。

Artificial Intelligence   (make machines act smart)
  └─ Machine Learning       (learn the rules from data)
       └─ Deep Learning      (learn with many-layered neural networks)

  examples:
    chess by brute-force search ... AI only
    spam filter from examples ..... AI + ML
    image / language models ....... AI + ML + Deep Learning
每个词都被装在它上面那个词里——是更窄,而不是另起一摊。

这层嵌套也讲出了一段历史。早期人工智能倚重符号规则与搜索;从数据中学习的那一派,叫作联结主义,曾被冷落多年,甚至熬过了几次因为承诺远超成果而导致的资金寒冬,史称人工智能寒冬。直到高速计算机和海量数据到来,深度学习才一跃居于中心。许多人从中得到的教训——能随算力扩展的通用方法,往往最终胜过手工打造的巧思——甚至有个专门的名字:苦涩的教训

窄与广:一招鲜,还是样样通?

接下来这条区分,是让你保持期待诚实的最重要的一条。你这辈子遇到的几乎每一个人工智能,都是窄人工智能:在某件具体的事上出神入化,出了那件事就一筹莫展。一个把国际象棋大师杀得片甲不留的程序,系不好一根鞋带、聊不了天,连跳棋都不会下。一个能在影像里揪出肿瘤的医学模型,根本不知道肿瘤是什么、病人是什么,也不知道在它那条窄道之外还存在任何东西。窄,不等于弱——这些系统在它那一件事上往往远超人类。它们只是没法靠自己把这身本事迁移到任何新东西上。

与之相对的是通用人工智能(AGI):一种假想的机器,能像人一样在任何领域学习和推理,捡起一项它当初根本没被设计来做的新技能。它并不存在。今天的聊天机器人之所以让人觉得「通用」,是因为它几乎什么都能聊,但底下它其实只是在把一件很窄的事做得极好——预测听起来合理的下一个词——而不是像你那样理解世界。那种灵活的感觉是真实而有用的;把它误当成真正的通用理解,才是当下最常见的过度宣称。

这里的「智能」到底指什么?

哲学家们为「智能」争论了千百年,所以人工智能多半绕开这个问题,改用一个可操作的检验:别管里面究竟在发生什么——这台机器能不能拿出我们会称之为聪明的行为?1950 年,阿兰·图灵提出的正是这一点。他的图灵测试问的不是「机器能思考吗?」,而是「它能不能聊得好到让人分不出对面是机器还是人?」凭行为判断,而不是凭某种我们无从测量的内在火花。

许多从业者采用的一个好用视角,是智能体观:智能系统就是任何能感知自己所处状况、并为达成某个目标而行动的东西。按这把尺子,恒温器是一个(极其迟钝的)智能体,自动驾驶汽车则是一个精巧的智能体。「智能」于是变成一个旋钮——一个智能体能在多少种情况下、把目标达成得多好——而不是一枚「是/否」的徽章。这种刻意的谦逊,正是这门学科能不断推进、而不是卡在定义上的一大原因。

你早已遇见的人工智能——以及它的边界

人工智能早已不是稀罕物,它静悄悄地穿过你的一天。替你整理收件箱的垃圾邮件过滤器,是从数百万封带标签的邮件里学出来的——这叫监督学习,从附带正确答案的例子里学习。地图给你挑的路线、手机按人脸把照片归堆、播放器替你排好的下一首歌、替你把句子补完的自动补全——每一个都是为某一件事训练出来的窄模型。最近最显眼的那张面孔是聊天机器人,它由一个基础模型驱动,先在浩瀚的文本上训练,再被调适到许多任务上。

那些里程碑式的胜利,套的也是同一个模式。深蓝在 1997 年战胜国际象棋世界冠军,主要靠的是计算数以百万计的棋局——更接近蛮力,而非学习。二十年后,阿尔法围棋攻克了围棋这个庞大到无法穷举的游戏,靠的是从棋谱中学、又跟自己对弈着学。两者都令人惊叹——也都很窄:除了那一种棋,它们什么都做不了。这道横在「炫目的专才本领」与「零通用能力」之间的鸿沟,正是今天所有人工智能的标志。

那就以一本诚实的账收尾。今天的人工智能在识别模式、生成流畅的文字与图像、以及在定义清楚的目标内做优化这几件事上,确实带来了变革。它同时也很脆:刚一走出训练范围,它就可能以幼稚的方式出错;它没有常识,也不懂因果;语言模型还会家常便饭般地产生幻觉——自信、流畅、却干脆是错的陈述。这条阶梯接下来会一层层搭起这些系统底下真正的机器,好让你分得清哪是真本事、哪是炒作——而这两样,都不少。