JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

從感知機到類腦人工智慧

神經元把收到的訊號加起來,再決定要不要放電。把這個想法精簡成算術,你就得到了感知機——現代人工智慧的種子。讓我們沿著這條線索,從那個玩具般的神經元一路走到今天的神經網絡,看清它們在哪裡與生物學分道揚鑣,並認識那些試圖彌合這道鴻溝的類腦硬體。

把神經元縮成一道算術題

想像一個神經元正在工作。幾十個別的細胞同時在對它低語——有的慫恿它,有的拉住它。神經元默默地把這些湧進來的「壓力」全部加總,如果總和越過某個臨界點,它就發出自己的訊號,也就是一次動作電位;如果總和不夠,它就保持沉默。把這件事濃縮到底,整個工作就是:收集輸入、給它們稱重、和一個閾值比較,然後放電或不放電。

1958 年,一位名叫弗蘭克·羅森布拉特的心理學家提出了一個大膽的問題:如果我們*只*保留那道算術,把所有雜亂的生物學都丟掉,會怎樣?他造出了一個微型模型,稱之為感知機。每個輸入都配一個數字,叫做*權重*,表示這個聲音該有多響。感知機把每個輸入乘上它的權重,全部加起來,再拿這個總和去和一個閾值比較。過線就輸出 1,不過線就輸出 0。沒有活細胞,沒有化學反應——只有乘、加、比較。

  input x1 --(weight w1)--\
  input x2 --(weight w2)----> [ SUM: w1*x1 + w2*x2 + ... ]
  input x3 --(weight w3)--/             |
                                        v
                              compare to threshold
                              over  -> output 1  (fire)
                              under -> output 0  (silent)
感知機:給每個輸入稱重,加總,若總和越過閾值就放電。

把它們疊起來,它們就會學習

單個感知機很聰明,卻很受限——它只能在輸入裡畫出一條筆直的分界線。真正的飛躍,來自把它們一層地疊起來:一排感知機的輸出,成為下一排的輸入,如此反覆。這種堆疊就是*人工神經網絡*,正是圖像識別、翻譯,以及你大概見過的那些聊天機器人背後的主力。寬度和深度給了它足夠的空間,去刻畫出任何一條直線都無法捕捉的、極其複雜的模式。

可所有這些權重又是從哪來的呢?沒有誰是手工設定的——網絡自己*學*出來的。你給它看一個例子,讓它猜,再量一量它猜得有多離譜。然後把每個權重朝著「能讓答案錯得少一點」的方向輕輕挪動一絲,如此重複上百萬次。慢慢地,權重就穩定到一組管用的數值上。這裡那一縷微弱的生物學回響,就是赫布學習——「一起放電的細胞,會連在一起」——大腦自己那種把有用的連接增強起來的習慣。

漫畫在哪裡不再是大腦

人們很容易以為這些網絡*就是*小小的大腦。它們不是,而且差別相當深。真實的神經元用尖銳的、全有或全無的脈衝說話,這些脈衝鋪展在時間裡——脈衝*何時*到來本身就承載著意義。相比之下,人工神經元只是傳遞一個平滑的數字,根本沒有時鐘;時間對它幾乎不存在。生物學家用霍奇金–赫胥黎模型,以及它更精簡的表親積分–發放模型來刻畫真實的時間節奏——而那些方程,和人工智慧裡那套整潔的「乘了再加」長得毫不相像。

差距還在累積。真實的大腦大約只靠一盞昏暗燈泡的功率運轉;而訓練一個大型人工智慧模型,可能需要一座小型發電站。大腦無時無刻不在重新佈線,看一個例子就能學會;人工網絡通常需要堆積如山的資料,而且一教新本事就把舊本事忘了。況且大腦並不是個被動的模式匹配器——按照預測編碼貝氏大腦這類理論,它永遠在*猜測接下來會發生什麼*並不斷自我修正,更像一個主動的預報員,而不是一台等著輸入的計算器。

把脈衝和時間放回去

要是我們重新教人工神經元用脈衝說話呢?這正是脈衝神經網絡背後的想法。在這裡,每個單元不再傾瀉出一個平滑的數字;它先攢著電荷,讓電荷隨著輸入一點點湧入而累積,一旦越過閾值,就在那一瞬間「啪」地發出一個離散的脈衝——然後安靜下來,重新開始。這正是活細胞那種「積分再發放」的節奏,只是為計算機重新打扮了一番。因為在脈衝發放之前什麼也不發生,網絡的大部分在大多數時間裡都是沉默的,這一點在能耗上可以省得驚人。

把這樣一個網絡放到普通的電腦晶片上跑,你會一路和硬體較勁——那些晶片是為了讓數字步調一致地批量運算而造的,不是為了乾等著那些稀疏、零散的脈衝。於是工程師們乾脆開始打造大腦形狀的晶片。這就是神經形態計算:在這種矽片裡,儲存和處理並排坐在一起(就像在一個突觸裡那樣),訊號以脈衝的形式傳遞,晶片可以幾乎零成本地閒著,直到有有趣的事情發生。目標不是把大腦一個細節一個細節地複製下來,而是借走它最妙的幾招——事件驅動、低功耗、大規模並行。

一場雙向的對話

這正是類腦人工智慧的核心,而關鍵詞是*受啟發*,不是*被複製*。這條路上的車流是雙向的。神經科學把它的藍圖——脈衝、可塑性、預測——遞給工程學,工程學再把它們做成能運轉的機器還回來;而這些機器,反過來又成了關於真實大腦可能如何運算的嶄新假設。當一個人工網絡以類似大腦的方式解決了一個問題,科學家就會追問:*我們*是不是也是這麼做的?類腦人工智慧與其說是一件完工的產品,不如說是一場持續的對話。

而這場對話即將變得很「實在」。隨著我們通過連接組學繪製出大腦完整的接線圖,隨著基於脈衝的晶片日漸成熟,這兩個世界開始在腦機介面處直接相觸——活的脈衝與矽的脈衝,終於隔著同一道縫隙相遇,並不得不學著讀懂彼此。那個相遇之處,正是本系列接下來要去的方向。

  1. 神經元拿輸入和閾值作比較;感知機恰恰保留了這一點,別的都不留。
  2. 把感知機疊成多層,讓它們自己調權重,你就得到了一台會學習的機器——神經網絡。
  3. 真實大腦則大不相同:脈衝承載著時間,學習又快又省,預測從不停歇。
  4. 脈衝網絡與神經形態晶片試圖把這些特質贏回來;類腦人工智慧就是由此產生的雙向交流。