从感知机到类脑人工智能

把神经元缩成一道算术题

想象一个神经元正在工作。几十个别的细胞同时在对它低语——有的怂恿它，有的拉住它。神经元默默地把这些涌进来的“压力”全部加总，如果总和越过某个临界点，它就发出自己的信号，也就是一次动作电位；如果总和不够，它就保持沉默。把这件事浓缩到底，整个工作就是：收集输入、给它们称重、和一个阈值比较，然后放电或不放电。

1958 年，一位名叫弗兰克·罗森布拉特的心理学家提出了一个大胆的问题：如果我们*只*保留那道算术，把所有杂乱的生物学都丢掉，会怎样？他造出了一个微型模型，称之为感知机。每个输入都配一个数字，叫做*权重*，表示这个声音该有多响。感知机把每个输入乘上它的权重，全部加起来，再拿这个总和去和一个阈值比较。过线就输出 1，不过线就输出 0。没有活细胞，没有化学反应——只有乘、加、比较。

  input x1 --(weight w1)--\
  input x2 --(weight w2)----> [ SUM: w1*x1 + w2*x2 + ... ]
  input x3 --(weight w3)--/             |
                                        v
                              compare to threshold
                              over  -> output 1  (fire)
                              under -> output 0  (silent)

感知机：给每个输入称重，加总，若总和越过阈值就放电。

把它们叠起来，它们就会学习

单个感知机很聪明，却很受限——它只能在输入里画出一条笔直的分界线。真正的飞跃，来自把它们一层层地叠起来：一排感知机的输出，成为下一排的输入，如此反复。这种堆叠就是*人工神经网络*，正是图像识别、翻译，以及你大概见过的那些聊天机器人背后的主力。宽度和深度给了它足够的空间，去刻画出任何一条直线都无法捕捉的、极其复杂的模式。

可所有这些权重又是从哪来的呢？没有谁是手工设定的——网络自己*学*出来的。你给它看一个例子，让它猜，再量一量它猜得有多离谱。然后把每个权重朝着“能让答案错得少一点”的方向轻轻挪动一丝，如此重复上百万次。慢慢地，权重就稳定到一组管用的数值上。这里那一缕微弱的生物学回响，就是赫布学习——“一起放电的细胞，会连在一起”——大脑自己那种把有用的连接增强起来的习惯。

漫画在哪里不再是大脑

人们很容易以为这些网络*就是*小小的大脑。它们不是，而且差别相当深。真实的神经元用尖锐的、全有或全无的脉冲说话，这些脉冲铺展在时间里——脉冲*何时*到来本身就承载着意义。相比之下，人工神经元只是传递一个平滑的数字，根本没有时钟；时间对它几乎不存在。生物学家用霍奇金–赫胥黎模型，以及它更精简的表亲积分–发放模型来刻画真实的时间节奏——而那些方程，和人工智能里那套整洁的“乘了再加”长得毫不相像。

差距还在累积。真实的大脑大约只靠一盏昏暗灯泡的功率运转；而训练一个大型人工智能模型，可能需要一座小型发电站。大脑无时无刻不在重新布线，看一个例子就能学会；人工网络通常需要堆积如山的数据，而且一教新本事就把旧本事忘了。况且大脑并不是个被动的模式匹配器——按照预测编码和贝叶斯大脑这类理论，它永远在*猜测接下来会发生什么*并不断自我修正，更像一个主动的预报员，而不是一台等着输入的计算器。

把脉冲和时间放回去

要是我们重新教人工神经元用脉冲说话呢？这正是脉冲神经网络背后的想法。在这里，每个单元不再倾泻出一个平滑的数字；它先攒着电荷，让电荷随着输入一点点涌入而累积，一旦越过阈值，就在那一瞬间“啪”地发出一个离散的脉冲——然后安静下来，重新开始。这正是活细胞那种“积分再发放”的节奏，只是为计算机重新打扮了一番。因为在脉冲发放之前什么也不发生，网络的大部分在大多数时间里都是沉默的，这一点在能耗上可以省得惊人。

把这样一个网络放到普通的电脑芯片上跑，你会一路和硬件较劲——那些芯片是为了让数字步调一致地批量运算而造的，不是为了干等着那些稀疏、零散的脉冲。于是工程师们干脆开始打造大脑形状的芯片。这就是神经形态计算：在这种硅片里，存储和处理并排坐在一起（就像在一个突触里那样），信号以脉冲的形式传递，芯片可以几乎零成本地闲着，直到有有趣的事情发生。目标不是把大脑一个细节一个细节地复制下来，而是借走它最妙的几招——事件驱动、低功耗、大规模并行。

一场双向的对话

这正是类脑人工智能的核心，而关键词是*受启发*，不是*被复制*。这条路上的车流是双向的。神经科学把它的蓝图——脉冲、可塑性、预测——递给工程学，工程学再把它们做成能运转的机器还回来；而这些机器，反过来又成了关于真实大脑可能如何运算的崭新假设。当一个人工网络以类似大脑的方式解决了一个问题，科学家就会追问：*我们*是不是也是这么做的？类脑人工智能与其说是一件完工的产品，不如说是一场持续的对话。

而这场对话即将变得很“实在”。随着我们通过连接组学绘制出大脑完整的接线图，随着基于脉冲的芯片日渐成熟，这两个世界开始在脑机接口处直接相触——活的脉冲与硅的脉冲，终于隔着同一道缝隙相遇，并不得不学着读懂彼此。那个相遇之处，正是本系列接下来要去的方向。

神经元拿输入和阈值作比较；感知机恰恰保留了这一点，别的都不留。
把感知机叠成多层，让它们自己调权重，你就得到了一台会学习的机器——神经网络。
真实大脑则大不相同：脉冲承载着时间，学习又快又省，预测从不停歇。
脉冲网络与神经形态芯片试图把这些特质赢回来；类脑人工智能就是由此产生的双向交流。