JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

从感知机到类脑人工智能

神经元把收到的信号加起来,再决定要不要放电。把这个想法精简成算术,你就得到了感知机——现代人工智能的种子。让我们沿着这条线索,从那个玩具般的神经元一路走到今天的神经网络,看清它们在哪里与生物学分道扬镳,并认识那些试图弥合这道鸿沟的类脑硬件。

把神经元缩成一道算术题

想象一个神经元正在工作。几十个别的细胞同时在对它低语——有的怂恿它,有的拉住它。神经元默默地把这些涌进来的“压力”全部加总,如果总和越过某个临界点,它就发出自己的信号,也就是一次动作电位;如果总和不够,它就保持沉默。把这件事浓缩到底,整个工作就是:收集输入、给它们称重、和一个阈值比较,然后放电或不放电。

1958 年,一位名叫弗兰克·罗森布拉特的心理学家提出了一个大胆的问题:如果我们*只*保留那道算术,把所有杂乱的生物学都丢掉,会怎样?他造出了一个微型模型,称之为感知机。每个输入都配一个数字,叫做*权重*,表示这个声音该有多响。感知机把每个输入乘上它的权重,全部加起来,再拿这个总和去和一个阈值比较。过线就输出 1,不过线就输出 0。没有活细胞,没有化学反应——只有乘、加、比较。

  input x1 --(weight w1)--\
  input x2 --(weight w2)----> [ SUM: w1*x1 + w2*x2 + ... ]
  input x3 --(weight w3)--/             |
                                        v
                              compare to threshold
                              over  -> output 1  (fire)
                              under -> output 0  (silent)
感知机:给每个输入称重,加总,若总和越过阈值就放电。

把它们叠起来,它们就会学习

单个感知机很聪明,却很受限——它只能在输入里画出一条笔直的分界线。真正的飞跃,来自把它们一层地叠起来:一排感知机的输出,成为下一排的输入,如此反复。这种堆叠就是*人工神经网络*,正是图像识别、翻译,以及你大概见过的那些聊天机器人背后的主力。宽度和深度给了它足够的空间,去刻画出任何一条直线都无法捕捉的、极其复杂的模式。

可所有这些权重又是从哪来的呢?没有谁是手工设定的——网络自己*学*出来的。你给它看一个例子,让它猜,再量一量它猜得有多离谱。然后把每个权重朝着“能让答案错得少一点”的方向轻轻挪动一丝,如此重复上百万次。慢慢地,权重就稳定到一组管用的数值上。这里那一缕微弱的生物学回响,就是赫布学习——“一起放电的细胞,会连在一起”——大脑自己那种把有用的连接增强起来的习惯。

漫画在哪里不再是大脑

人们很容易以为这些网络*就是*小小的大脑。它们不是,而且差别相当深。真实的神经元用尖锐的、全有或全无的脉冲说话,这些脉冲铺展在时间里——脉冲*何时*到来本身就承载着意义。相比之下,人工神经元只是传递一个平滑的数字,根本没有时钟;时间对它几乎不存在。生物学家用霍奇金–赫胥黎模型,以及它更精简的表亲积分–发放模型来刻画真实的时间节奏——而那些方程,和人工智能里那套整洁的“乘了再加”长得毫不相像。

差距还在累积。真实的大脑大约只靠一盏昏暗灯泡的功率运转;而训练一个大型人工智能模型,可能需要一座小型发电站。大脑无时无刻不在重新布线,看一个例子就能学会;人工网络通常需要堆积如山的数据,而且一教新本事就把旧本事忘了。况且大脑并不是个被动的模式匹配器——按照预测编码贝叶斯大脑这类理论,它永远在*猜测接下来会发生什么*并不断自我修正,更像一个主动的预报员,而不是一台等着输入的计算器。

把脉冲和时间放回去

要是我们重新教人工神经元用脉冲说话呢?这正是脉冲神经网络背后的想法。在这里,每个单元不再倾泻出一个平滑的数字;它先攒着电荷,让电荷随着输入一点点涌入而累积,一旦越过阈值,就在那一瞬间“啪”地发出一个离散的脉冲——然后安静下来,重新开始。这正是活细胞那种“积分再发放”的节奏,只是为计算机重新打扮了一番。因为在脉冲发放之前什么也不发生,网络的大部分在大多数时间里都是沉默的,这一点在能耗上可以省得惊人。

把这样一个网络放到普通的电脑芯片上跑,你会一路和硬件较劲——那些芯片是为了让数字步调一致地批量运算而造的,不是为了干等着那些稀疏、零散的脉冲。于是工程师们干脆开始打造大脑形状的芯片。这就是神经形态计算:在这种硅片里,存储和处理并排坐在一起(就像在一个突触里那样),信号以脉冲的形式传递,芯片可以几乎零成本地闲着,直到有有趣的事情发生。目标不是把大脑一个细节一个细节地复制下来,而是借走它最妙的几招——事件驱动、低功耗、大规模并行。

一场双向的对话

这正是类脑人工智能的核心,而关键词是*受启发*,不是*被复制*。这条路上的车流是双向的。神经科学把它的蓝图——脉冲、可塑性、预测——递给工程学,工程学再把它们做成能运转的机器还回来;而这些机器,反过来又成了关于真实大脑可能如何运算的崭新假设。当一个人工网络以类似大脑的方式解决了一个问题,科学家就会追问:*我们*是不是也是这么做的?类脑人工智能与其说是一件完工的产品,不如说是一场持续的对话。

而这场对话即将变得很“实在”。随着我们通过连接组学绘制出大脑完整的接线图,随着基于脉冲的芯片日渐成熟,这两个世界开始在脑机接口处直接相触——活的脉冲与硅的脉冲,终于隔着同一道缝隙相遇,并不得不学着读懂彼此。那个相遇之处,正是本系列接下来要去的方向。

  1. 神经元拿输入和阈值作比较;感知机恰恰保留了这一点,别的都不留。
  2. 把感知机叠成多层,让它们自己调权重,你就得到了一台会学习的机器——神经网络。
  3. 真实大脑则大不相同:脉冲承载着时间,学习又快又省,预测从不停歇。
  4. 脉冲网络与神经形态芯片试图把这些特质赢回来;类脑人工智能就是由此产生的双向交流。