JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

轻松微缩时代的终结

四十年来,芯片同时变得更快、更便宜、更省电——工程师几乎不必追问为什么。这趟免费的顺风车有它的名字,也有它的引擎,而这台引擎在2006年前后悄然熄火了。这篇开篇导读拆解人人都会混淆的两条定律——摩尔定律和登纳德缩放——告诉你究竟是什么停滞了,为什么一颗'3nm'芯片上根本没有任何3纳米宽的东西,以及为什么本系列其余每一个巧妙招数,都是为了绕开某一堵墙而存在。

摩尔定律的承诺

1965年,戈登·摩尔注意到一件好得几乎不真实的事:一颗芯片上能塞进的晶体管数量,正以稳定得近乎钟表般的节奏翻倍——他打赌这会一直持续下去。他赌对了半个世纪。这个赌注就是[[moores-law|摩尔定律]],也正因为它,1975年的超级计算机如今才能装进你的口袋,价格还不到一顿饭钱。

不过要仔细读这条定律,因为几乎人人都记错了。摩尔定律讲的是数量——在给定面积里能放下多少晶体管,大约每两年翻一番。它对这些晶体管开关得多快、耗多少电、每个有多便宜*只字未提*。几十年里,人们感受到这三件事同时改善,便在脑子里悄悄把它们都打包进了'摩尔定律'。他们其实是在搭乘*另一份*独立的馈赠——而那一份的租期要短得多。

登纳德缩放:免费的午餐

还有一份人们忘了说出名字的馈赠。1974年,罗伯特·登纳德算清了缩小一个晶体管的这笔账:如果你把每个尺寸都按同一倍数缩小,*并且*把供电电压也按同一倍数降低,那么挤进每平方毫米里的功率就保持恒定。晶体管更小、电压更低、单位面积的发热不变。这就是[[dennard-scaling|登纳德缩放]],也是'计算机就是会越来越好'背后真正的引擎。

细想一下这有多慷慨。每一个新世代给你的晶体管更小(多谢摩尔),*而且*更快(距离更短,开关更利落),*而且*整颗芯片一点都没变热,因为每个器件随着缩小都更省电了。设计者只需把多出来的晶体管花掉,再把时钟频率往上拉,一代又一代,热预算从不寄来账单。速度、密度和能效一次打包到手——而且关键在于,你*无需*重新设计什么巧妙的东西就能收下它。你只要等下一个节点就行。

午餐为何散场(功耗墙)

登纳德缩放建立在一个不动声色的假设之上:你可以让供电电压跟着尺寸同步往下降。可到了2005—2006年前后,电压就是死活不肯再降了。晶体管需要在'关'与'开'之间有一道有意义的差距;电压压得太低,一个本该'关'的晶体管照样会漏电,就像一个永远关不严的水龙头。漏电不再是可以忽略不计的零头,而是开始主导一切。于是电压趋于平坦——而它一平坦,那本让单位面积功率保持恒定的账,就再也算不平了。

其后果就是功耗墙。晶体管继续缩小(摩尔照旧兑现),但如今每个晶体管不再按比例变得更省电,于是往同一块面积里塞进更多晶体管,就意味着那块面积上更多的瓦数、更多的热量。一颗芯片能散出的热量是有上限的,超过了就会被烤熟。到2000年代中期,那个咆哮着向上冲了二十年的时钟频率撞上了天花板,此后几乎纹丝不动,徘徊在几个吉赫兹的区间。免费的速度,没了。

          ~1985 ----------------- 2006 ----------------- today

Transistors/chip   doubling ........ doubling ........ doubling*  (Moore: alive)
Clock frequency    climbing ........  PLATEAU ......... ~flat      (the wall)
Power per transistor  falling ......  STALLS  ......... ~flat      (Dennard: dead)
Chip heat budget   easy ............ TIGHT ........... the hard limit

* still doubling, but slower and far more expensive per step
摩尔定律(第一行)仍在继续;登纳德缩放(下面几行)在2006年前后死去。这几行之间的分裂,就是本系列存在的全部理由。

更高的速度既已无望,业界便横向转身:单个核心快不起来,那就上更多核心。这就是2000年代中期的多核转向——你的手机和笔记本电脑之所以有那么多核心,正是因为没有任何单个核心还能继续往上爬。但这次转身又揭出了一条更难堪的真相:当晶体管堆积的速度快过功率预算的增长,你就再也供不起让它们同时全部开启。任何时刻你不得不让其熄灭的那一部分,就是暗硅——那些你拥有、付了钱、却无法一起点亮的晶体管。功耗墙不只是叫停了时钟,它还改变了一颗芯片被允许去做的事。

如今'一个节点'的名字意味着什么

你会听到芯片被用一个节点名字来描述——'7nm'、'5nm'、'3nm'、'2nm'——很容易让人脑补芯片上真有个那么多纳米宽的东西。并没有。几十年前,节点数字大致对应一个晶体管的栅长,所以那个标签确实有物理含义。这层联系多年前就断了。如今一个'3nm'节点上*没有任何单一特征*量起来是三纳米;栅长仍比这个标签大上好几倍。

那这个数字到底是什么?如今它本质上是一个营销标签——给整整一个制造世代起的品牌名,意在传达'比上一代更密、更好'。更糟的是,各公司之间的标签并不可比:一家代工厂的'3nm'和另一家的,是配方不同、密度也不同的两套工艺,命名是为了竞争,而不是为了度量。比较节点的老实办法,是看它们实际交付了什么——晶体管密度、速度和功耗——而不是看那个营销出来的纳米数。

成本:另一堵墙

在那顿旧日免费午餐里还搭着*第三份*馈赠,而它或许是我们最怀念的一份:每一个新节点都曾让每个晶体管变得更便宜。每片晶圆上的晶体管更多,晶圆成本却差不多,于是单个晶体管的成本一代接一代地往下掉。正是这一点,让'只管等下一个节点'不仅是一项技术策略,也成了一项稳赢的商业策略。

在最前沿,那条曲线已经走平——而对许多设计来说,它干脆不再下降了。印制最先进节点所需的机器和掩模(极紫外光刻、愈发复杂的图形化工艺)贵得惊人,如今在尖端节点上设计一颗芯片,动辄要烧掉数亿美元。你拿到的晶体管确实*更多*,但每一个却不再可靠地变得*更便宜*。破天荒头一回,一个团队可以理性地、有意地去选一个更老、更便宜的节点。

逃生路线的菜单

于是,轻松微缩的时代结束了。登纳德缩放已死(功耗墙),摩尔定律在放缓且愈发昂贵(成本墙),而节点数字也不再有任何物理含义。但这些都不意味着进步停了——它们只意味着进步不再*免费*。如今每一分收益,都得针对某一道具体的极限,被刻意地*工程化*出来。本系列其余的内容正是如此:一份逃生路线的菜单,其中每一道菜,都是对我们刚刚点过名的某一堵墙的巧妙回答。

  1. 重塑晶体管本身——从平面器件,到三维鳍式(FinFET),再到环绕栅极纳米片(GAA),有朝一日还有堆叠的CFET——好把漏电压住,让密度继续往上爬。
  2. 用更好的光把图形印得更精细——极紫外光刻(EUV)及其高NA后继者——好让最小的特征压根能被画出来,而不必绕一大堆荒唐的弯路。
  3. 修的不只是开关,还有连线——因为缩小后的互连如今反过来限制了速度和功耗;把供电挪到晶圆背面(背面供电)能腾出正面给信号走线。
  4. 往第三个维度堆叠——用硅通孔(TSV)和混合键合把裸片一片叠一片地接合起来,让存储与逻辑挨得更近,直击带宽(存储)墙。
  5. 拆开再重组——把一个大设计拆成若干芯粒,用一套开放的裸片对裸片标准(UCIe)连起来,混搭不同节点、提升良率,而不是把全部赌注押在一整块巨大的裸片上。
  6. 别再做通用件——为单一任务量身定制专用芯片(现代AI加速器背后的领域专用架构),让每一瓦电干的活,超过任何通用核心所能企及。

留意这里的规律:每一条逃生路线,回应的都是一道你已经叫得出名字的*具体*极限。这就是贯穿整个系列的那副眼镜。在你学一项技术*做什么*之前,先问它当初是为了翻越*哪一堵墙*而被发明出来的。把这个问题攥在手里,前沿就不再像一堆时髦词的大杂烩,而开始显出它本来的样子——一连串刻意为之、来之不易的回答,回应着那顿免费午餐散场的那一天。