特徵值與特徵函數

從「只有零」到一個值得問的問題

在上一篇導引中，你認識了邊值問題及其令人不安的習性：與初值問題不同，它並不保證恰好有一個解。一個齊次邊值問題——方程等於零，兩端的條件也都等於零——永遠有那個平凡解 y = 0。真正深刻的問題是：它何時還有「別的」解。多數情況下答案是斬釘截鐵的「沒有」。但那個「多數情況」正藏著整個學科，因為例外之處，才是樂音所在。

讓例外應聲現身的訣竅就在這裡。取那個齊次方程，往裡頭塞進一個可調的數。最乾淨、也是整套理論賴以建立的範例，是區間 0 <= x <= L 上的 y'' + lambda y = 0，邊界條件為 y(0) = 0 與 y(L) = 0。邊界條件固定不動；那個數 lambda 則是一個我們可以轉動的旋鈕。對旋鈕幾乎每一種設定，唯一的解都是 y = 0。但在某些特殊設定上——而且僅僅在那些設定上——一個如假包換的非零解會喀地一聲冒出來。把轉動 lambda 變成一場對那些特殊設定的搜捕，正是特徵值問題。

把矩陣圖像提升到函數

在我們動手計算之前，先牢牢握住線性代數的圖像是值得的，因為這裡的每一步都是你早已熟悉之事的翻譯。在有限維中，A x = lambda x 說的是：把向量 x 餵給矩陣 A，得到的不是一個泛泛的新向量，而是同一個 x 被 lambda 縮放後的結果。這樣的 x 是特徵向量，而縮放因子 lambda 是它的特徵值。重點全在於：這只對特殊的方向發生——大多數向量都會被轉成某個毫不相干的東西。

現在來執行這個提升。把矩陣 A 換成微分算子「取 y''（並遵守 y(0) = y(L) = 0）」，把向量 x 換成函數 y(x)，把普通的縮放換成方程 y'' = -lambda y。把最後這一行慢慢讀：它說把算子作用在 y 上，回傳的還是 y 本身，只是乘上了常數 -lambda。函數通過算子後形狀絲毫未變，只被重新縮放——這正是特徵向量所做的事。具備這種魔法性質的函數是一個特徵函數，而讓它成立的那個 lambda 就是它的特徵值。

  finite dimensions          functions on [0, L]
  -----------------          -------------------------------
  matrix A             <-->   operator  y -> -y''   (with y(0)=y(L)=0)
  vector x             <-->   function  y(x)
  A x = lambda x       <-->   -y'' = lambda y
  eigenvector x        <-->   eigenfunction y(x)
  eigenvalue lambda    <-->   eigenvalue lambda

這部對照辭典。把 -y'' = lambda y 讀成「算子把 y 拉伸了 lambda 倍」，就能讓後面每一步都成為熟悉的動作。

逐一檢視符號，解開範例問題

讓我們真的來捕獵 y'' + lambda y = 0（搭配 y(0) = y(L) = 0）的特徵值。誠實的做法是：對 lambda 每一種可能的符號，先把方程一般地解開，再去問邊界條件有沒有任何非零的東西能存活下來。這不是一個要死背的把戲——它就是整套方法，而你日後遇到的每一個斯圖姆－劉維爾問題，都由這同一份耐心的分類討論解開。

情形 lambda < 0（寫成 lambda = -k^2）。通解由 e^(kx) 與 e^(-kx) 組成——純粹的成長與衰減，毫無擺盪。在這類曲線上強加 y(0) = 0 與 y(L) = 0，只剩下 y = 0。這裡沒有特徵值：指數函數除非整條都是零，否則無法在第二個點再次回到零。
情形 lambda = 0。方程只是 y'' = 0，於是 y = a x + b，一條直線。同時通過 (0, 0) 與 (L, 0) 的直線就是那條平的 y = 0。又只剩平凡解。零對這個問題而言也不是特徵值。
情形 lambda > 0（寫成 lambda = mu^2）。現在解開始振盪：y = A cos(mu x) + B sin(mu x)。條件 y(0) = 0 殺掉餘弦項，剩下 y = B sin(mu x)。餘下的條件 y(L) = 0 要求 sin(mu L) = 0——而「這」正是敞開的那扇門。
讀出量子化。sin(mu L) = 0 迫使 mu L = n pi，其中 n = 1, 2, 3, ... 是整數。於是被允許的值為 lambda_n = (n pi / L)^2，各自配上自己的形狀 y_n(x) = sin(n pi x / L)。我們可以丟掉常數 B，因為特徵函數的任意非零倍數仍是特徵函數。

退一步，細細品味剛剛發生的事。一個連續的旋鈕 lambda，本可取遍每一個實數，卻被兩個看似無害的邊界條件逼得塌縮到一道離散的階梯 lambda_1, lambda_2, lambda_3, ... 上——也就是那些平方 (pi/L)^2、(2 pi/L)^2、(3 pi/L)^2，一路爬向無窮。連續地進去，離散地出來。這就是量子化，而它正是吉他弦發出一個確定的音高及其泛音的數學理由，也是被囚禁的量子粒子擁有離散能階、而非連續一片模糊的理由。特徵函數 sin(n pi x / L) 恰恰就是那些駐波的形狀：n = 1 是基本的拱形，n = 2 在內部有一個節點，n = 3 有兩個，如此沿著階梯往上。

什麼會改變答案——什麼不會

初學者常有一個信念，以為特徵值是屬於方程 y'' + lambda y = 0 的。並非如此。它們屬於那個方程「連同它的邊界條件」；換掉條件，你通常就換掉了整道階梯。把 y(L) = 0 換成斜率條件 y'(L) = 0（一個自由或絕熱的端點，而非夾緊的端點），開門的條件就變成 cos(mu L) = 0，於是特徵值變為 ((2n-1) pi / 2L)^2，特徵函數變為 sin((2n-1) pi x / 2L)——同一個微分方程，卻得到不同的階梯、不同的形狀。這正是為什麼邊值問題與初值問題是兩種不同的生物。

有兩個規律確實在所有標準情形中存活下來，值得你信賴。第一，特徵值構成一個遞增、向無窮進軍的數列 lambda_1 < lambda_2 < lambda_3 < ...，從不擠成一團，也從不回頭下降。第二，第 n 個特徵函數在內部恰好有 n-1 個零點——每往上爬一階就多擺盪一次。第二件事絕非偶然；它正是你將在下一篇導引中按名認識的振盪定理的內容，而它讓你只要數一數節點，就能對特徵函數做合理性檢查。

為什麼這值得在意：這些形狀構成一組基底

若只到找出一道特殊函數的階梯為止，那不過是樁奇聞。但它不止於此，而這裡正是讓整個階梯值得攀登的回報。特徵函數 sin(n pi x / L) 是彼此正交的：把其中兩個不同的相乘、在 [0, L] 上積分，你會剛好得到零。它們的表現就像互相垂直的坐標軸——只是身處一個「點」皆為整個函數的空間裡。那份正交性正是讓你能把它們當作一套坐標系的性質，也是後兩篇導引中一切事物的種子。

正交的坐標軸，正是你把區間上任何合理的函數 f(x) 寫成這些基本形狀的加權和所需要的，f(x) = c_1 sin(pi x / L) + c_2 sin(2 pi x / L) + ...，並且能乾淨地讀出每一個係數——這就是特徵函數展開，而在這個特定情形下，它就是傅立葉正弦級數。這也是為什麼特徵值問題是通往分離變數法的橋梁：當你把熱方程或波動方程拆成空間乘以時間時，空間因子恰好落到這個問題上，特徵函數成為基石般的模態，而每個模態都各自獨立地隨時間演化。你找到的那道離散階梯，按字面意思說，就是系統各個自然模態的清單。

所以本篇導引是整個階梯的樞紐。你身後坐著那個赤裸的邊值問題及其平凡解；你前方則躺著斯圖姆－劉維爾理論，它將解釋「為什麼」特徵值是實數、為什麼階梯一路爬向無窮、以及為什麼特徵函數總是正交的——這些承諾，我們此處只在一個幸運的範例上嚐了一口。請帶走那個能把這一切組織起來的單一圖像：一個微分算子，就像一個矩陣，擁有它僅僅重新縮放的特殊輸入，而在邊界處，那些特殊輸入排成一道離散、正交的形狀階梯。