JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

覆晶、凸塊與底膠:現代第一層連接

幾十年來,晶片是靠從邊緣繞出來、細如髮絲的金線跟外界對話——很美,卻是個瓶頸。後來有人問:何必把訊號全都爬到晶片邊緣才送出去?把晶粒*翻過來*,臉朝下扣到一整片焊錫球上,讓矽的每個角落同時碰到封裝。就是這麼一翻——[[ic-flip-chip|覆晶]]——讓現代 GPU 能有上萬個連接、而不是區區幾百個;也讓一滴黏黏的[[ic-underfill|底膠]],悄悄撐住整個結構、不讓它把自己撕裂。

翻轉晶粒:從邊緣到整張臉

在第一關你認識了經典的打線:晶粒臉朝,黏在封裝上,機器把細如髮絲的金線或銅線,從晶片*邊緣*上的每個焊墊一根根縫到基板上。它能用、便宜,每年出貨數以兆計。但注意它的幾何形狀——每一條連接都得抵達周邊。一塊方形晶粒就只有那麼多邊,遲早會沒地方放。一塊 10 mm、焊墊間距 50 µm 的晶粒,繞著邊緣大概塞得下兩三千條線,而每一條都是一根又長、又帶電感的小天線。

覆晶把「只能用周邊」這條規則整個丟掉。直接在晶片焊墊上長出微小的焊錫凸塊——不只繞邊緣,而是鋪滿整張臉,排成一個叫做*面陣列(area array)*的規則格子。接著把晶粒實實在在地翻過來,臉朝下對準封裝基板上相符的焊墊格子放下,再一次把所有凸塊熔接,讓每一顆都形成永久接點。如今整個二維的矽表面都接上了線,而不只是它那條一維的邊界。可用連接數,從*周邊*(與邊長成正比)一躍變成*面積*(與邊長平方成正比)。

Wire bond (peripheral)        Flip-chip (area array)

  pads only on the edge          pads across the whole face
  +-----------------+            +-----------------+
  | o o o o o o o o |            | o o o o o o o o |
  | o             o |            | o o o o o o o o |
  | o   (die)     o |            | o o o(die)o o o |
  | o             o |            | o o o o o o o o |
  | o o o o o o o o |            | o o o o o o o o |
  +--\___________/--+            +--(face-down)----+
   gold wires loop out             bumps join straight down

  I/O count ~ 4 * (side / pitch)   I/O count ~ (side / pitch)^2
  e.g. 10mm @ 150um pitch:         e.g. 10mm @ 150um pitch:
        ~ 260 wires                      ~ 4400 bumps
周邊 vs. 面積。打線隨晶粒的*邊*擴張;覆晶凸塊隨整張*臉*擴張——同一塊矽上能多出一個數量級的 I/O。

長出凸塊:電鍍、回焊與自我對準

焊錫凸塊不會直接長在裸鋁上——焊錫沾不上去,還會毒化底下的金屬。所以在放任何焊錫之前,晶圓廠會先鍍上一層凸塊下金屬層(UBM):一疊薄薄的金屬(常用 Ti 或 Cr 增加附著,再來 Cu,最後封一層 Ni),焊錫樂於潤濕它,它也充當擴散阻障。凸塊本身才在 UBM 上長出來——經典做法是把焊錫電鍍進光阻遮罩的開口裡,不過印膏、植球也都行。到這一步,你手上就有一片插滿數千根矮胖焊錫柱的晶圓。

魔法發生在回焊(reflow)。把翻好的晶粒放到基板上,讓每顆凸塊正好坐在目標焊墊上,再把整個組件加熱越過焊錫熔點。每根焊柱塌成一顆熔融的小球——這時表面張力會幹一件美妙的事。液態凸塊想讓表面積最小,於是它會把晶粒拉到跟底下焊墊近乎完美的對齊,就算放置機台原本偏了好幾微米也一樣。接著組件冷卻、接點凝固。這種溫和的自我修正,就是「受控塌陷」——也讓最初 IBM 的這種接點得到它著名的名字:C4——受控塌陷晶片連接(Controlled Collapse Chip Connection)

  1. 鍍 UBM——在每個焊墊上濺鍍一疊薄薄的附著/阻障/可潤濕金屬,讓焊錫能接合、又不會吃掉晶片金屬。
  2. 長凸塊——把焊錫電鍍(或印刷)進遮罩開口裡,再剝掉遮罩,晶圓上便留下一根根焊柱。
  3. 切割並翻面——把晶圓鋸成一顆顆晶粒,每顆都翻成臉朝下,對準基板。
  4. 回焊——加熱到焊錫熔點以上;凸塊熔化,表面張力讓晶粒自我對準,再冷卻、定位鎖死。
  5. 清洗並填底膠——洗掉助焊劑殘留,接著在最後固化前注入底膠(下一節)。

C4 與微凸塊:兩種尺寸、兩種任務

凸塊並非都一樣大,而尺寸會告訴你它的任務。經典的 C4 凸塊是大顆的那種:高約 80–150 µm、間距約 130–200 µm,用來把晶粒直接接到有機封裝基板上。它們扛得了不小的電流,吃得下有機基板那種較粗的結構,三十年來一直是覆晶的主力。把它們想成封裝裡那種粗壯的鉚釘。

微凸塊(microbump)則是又新又小的表親:銅柱頂端只蓋一薄片焊錫,寬僅約 10–25 µm,間距已從 40 µm 一路逼近 10 µm 甚至更小。它們密到根本落不到有機基板上,所以是用來接晶粒對晶粒、或晶粒對矽中介層——正是我們在 2.5D3D 整合堆疊晶片時會重複用到的積木。銅柱讓接點又高又硬、鄰居不會橋接,而頂上那薄薄的焊錫帽,仍提供一個能自我對準、可回焊的連接。

                     C4 bump            Microbump (Cu pillar)
  diameter           ~80-120 um         ~10-25 um
  pitch              ~130-200 um        ~40 um -> 10 um (and falling)
  joins              die -> substrate   die -> die / die -> interposer
  structure          solder ball        Cu pillar + thin solder cap
  current per bump    high               low (but thousands of them)
  role               1st-level to pkg   dense chip-to-chip / 3D stack

   die  [][][][][][][][][][][][]   <- microbumps (fine)
        ==========================
        interposer / lower die
         O   O   O   O   O   O      <- C4 bumps (coarse) to substrate
        +--------------------------+
        |    package substrate     |
同一個堆疊裡的兩種尺度:上方用細微凸塊把晶粒縫在一起,下方用粗 C4 凸塊把整個組件接到基板。

為什麼底膠不是可有可無

面陣列這麼好用,帳單在這裡。矽和有機封裝基板是不同的材料,加熱或冷卻時膨脹的幅度不一樣——它們的熱膨脹係數(CTE)不同。矽幾乎不動(約 2.6 ppm/°C);有機基板膨脹得好幾倍(約 17 ppm/°C)。每當晶片開機升溫、或關機降溫,基板就在那塊硬挺晶粒*底下*伸縮,而晶粒卻幾乎不動。夾在中間的焊錫凸塊,被來回剪切,就像橋上的鉚釘在熱脹冷縮中反覆受力。

受力最慘的凸塊,是離晶粒中心最遠的那些——四個角——因為剪切量隨離中性點的距離(DNP)而增大。放著不管,那些角落接點會在數千次電源循環中累積疲勞裂紋,最後失效。解藥是底膠:一種掺了細二氧化矽填料的液態環氧樹脂,沿晶粒邊緣點出,靠毛細作用滲進晶粒與基板之間那道細縫,把每顆凸塊都包起來。等它固化成堅硬的固體,便把整層三明治黏成一體,讓晶粒與基板像同一塊物體般一起動——並把熱機械應力從脆弱的焊接點上卸下,分散到整個接合面積。

Without underfill: substrate stretches, die doesn't -> bump shears

   die    [###]  [###]  [###]  [###]      (rigid, low CTE)
           ||     ||     ||     ||
   bumps   \\     ||     //    ///   <- corners sheared the most
   sub  -->-->-->-->|<--<--<--<--<--    (expands more, high CTE)
          farther from centre = bigger shear = first to crack

With underfill: epoxy locks die + substrate as one body

   die    [#######################]
          [ssssss UNDERFILL ssssss]   <- shares the stress over
          [ o    o    o    o    o ]      the WHOLE bonded area;
   sub    [#######################]      each bump sees far less

   Result: thermal-cycle lifetime improves by ~10x or more.
底膠把晶粒與基板耦合在一起、讓它們一同膨脹,把 CTE 失配的剪切從原本最先開裂的角落凸塊上重新分散開來。

更細的間距:更多頻寬、更少餘裕

為什麼整個產業不斷把凸塊推得更小?因為兩顆晶片間的頻寬,大致是*線數 × 每條線速度*。把間距減半,同樣的佔位面積就塞得下四倍的凸塊(這是面積,隨 1/間距² 擴張)——四倍的平行線數、四倍的原始頻寬,而且不必把任何一條連結時脈拉得更快。正是這根槓桿,讓 HBM 堆疊能透過數千條細微凸塊一次跟邏輯晶粒對話,而非靠寥寥幾條快到尖叫的串列通道。

但你從間距上每削掉一微米,就同時在好幾條戰線上吃掉可靠度餘裕。凸塊越小,每顆能扛的電流越少(對供電不利,也更容易發生[[electromigration|電遷移]]——原子在高電流密度下實實在在地遷出接點)。間距更緊,意味著更小的對位偏差就能把兩個鄰居橋接成短路,而回焊時自我對準的回復力也更弱。再者,底膠的縫隙變得太薄,二氧化矽填料顆粒幾乎擠不進去——環氧樹脂根本流不到晶粒底下,逼著改用預塗或模封型底膠。頻寬與可靠度往相反方向拉扯;先進封裝,就是這場取捨的藝術。