從「只有零」到一個值得問的問題
在上一篇導引中,你認識了邊值問題及其令人不安的習性:與初值問題不同,它並不保證恰好有一個解。一個齊次邊值問題——方程等於零,兩端的條件也都等於零——永遠有那個平凡解 y = 0。真正深刻的問題是:它何時還有「別的」解。多數情況下答案是斬釘截鐵的「沒有」。但那個「多數情況」正藏著整個學科,因為例外之處,才是樂音所在。
讓例外應聲現身的訣竅就在這裡。取那個齊次方程,往裡頭塞進一個可調的數。最乾淨、也是整套理論賴以建立的範例,是區間 0 <= x <= L 上的 y'' + lambda y = 0,邊界條件為 y(0) = 0 與 y(L) = 0。邊界條件固定不動;那個數 lambda 則是一個我們可以轉動的旋鈕。對旋鈕幾乎每一種設定,唯一的解都是 y = 0。但在某些特殊設定上——而且僅僅在那些設定上——一個如假包換的非零解會喀地一聲冒出來。把轉動 lambda 變成一場對那些特殊設定的搜捕,正是特徵值問題。
把矩陣圖像提升到函數
在我們動手計算之前,先牢牢握住線性代數的圖像是值得的,因為這裡的每一步都是你早已熟悉之事的翻譯。在有限維中,A x = lambda x 說的是:把向量 x 餵給矩陣 A,得到的不是一個泛泛的新向量,而是同一個 x 被 lambda 縮放後的結果。這樣的 x 是特徵向量,而縮放因子 lambda 是它的特徵值。重點全在於:這只對特殊的方向發生——大多數向量都會被轉成某個毫不相干的東西。
現在來執行這個提升。把矩陣 A 換成微分算子「取 y''(並遵守 y(0) = y(L) = 0)」,把向量 x 換成函數 y(x),把普通的縮放換成方程 y'' = -lambda y。把最後這一行慢慢讀:它說把算子作用在 y 上,回傳的還是 y 本身,只是乘上了常數 -lambda。函數通過算子後形狀絲毫未變,只被重新縮放——這正是特徵向量所做的事。具備這種魔法性質的函數是一個特徵函數,而讓它成立的那個 lambda 就是它的特徵值。
finite dimensions functions on [0, L] ----------------- ------------------------------- matrix A <--> operator y -> -y'' (with y(0)=y(L)=0) vector x <--> function y(x) A x = lambda x <--> -y'' = lambda y eigenvector x <--> eigenfunction y(x) eigenvalue lambda <--> eigenvalue lambda
逐一檢視符號,解開範例問題
讓我們真的來捕獵 y'' + lambda y = 0(搭配 y(0) = y(L) = 0)的特徵值。誠實的做法是:對 lambda 每一種可能的符號,先把方程一般地解開,再去問邊界條件有沒有任何非零的東西能存活下來。這不是一個要死背的把戲——它就是整套方法,而你日後遇到的每一個斯圖姆-劉維爾問題,都由這同一份耐心的分類討論解開。
- 情形 lambda < 0(寫成 lambda = -k^2)。通解由 e^(kx) 與 e^(-kx) 組成——純粹的成長與衰減,毫無擺盪。在這類曲線上強加 y(0) = 0 與 y(L) = 0,只剩下 y = 0。這裡沒有特徵值:指數函數除非整條都是零,否則無法在第二個點再次回到零。
- 情形 lambda = 0。方程只是 y'' = 0,於是 y = a x + b,一條直線。同時通過 (0, 0) 與 (L, 0) 的直線就是那條平的 y = 0。又只剩平凡解。零對這個問題而言也不是特徵值。
- 情形 lambda > 0(寫成 lambda = mu^2)。現在解開始振盪:y = A cos(mu x) + B sin(mu x)。條件 y(0) = 0 殺掉餘弦項,剩下 y = B sin(mu x)。餘下的條件 y(L) = 0 要求 sin(mu L) = 0——而「這」正是敞開的那扇門。
- 讀出量子化。sin(mu L) = 0 迫使 mu L = n pi,其中 n = 1, 2, 3, ... 是整數。於是被允許的值為 lambda_n = (n pi / L)^2,各自配上自己的形狀 y_n(x) = sin(n pi x / L)。我們可以丟掉常數 B,因為特徵函數的任意非零倍數仍是特徵函數。
退一步,細細品味剛剛發生的事。一個連續的旋鈕 lambda,本可取遍每一個實數,卻被兩個看似無害的邊界條件逼得塌縮到一道離散的階梯 lambda_1, lambda_2, lambda_3, ... 上——也就是那些平方 (pi/L)^2、(2 pi/L)^2、(3 pi/L)^2,一路爬向無窮。連續地進去,離散地出來。這就是量子化,而它正是吉他弦發出一個確定的音高及其泛音的數學理由,也是被囚禁的量子粒子擁有離散能階、而非連續一片模糊的理由。特徵函數 sin(n pi x / L) 恰恰就是那些駐波的形狀:n = 1 是基本的拱形,n = 2 在內部有一個節點,n = 3 有兩個,如此沿著階梯往上。
什麼會改變答案——什麼不會
初學者常有一個信念,以為特徵值是屬於方程 y'' + lambda y = 0 的。並非如此。它們屬於那個方程「連同它的邊界條件」;換掉條件,你通常就換掉了整道階梯。把 y(L) = 0 換成斜率條件 y'(L) = 0(一個自由或絕熱的端點,而非夾緊的端點),開門的條件就變成 cos(mu L) = 0,於是特徵值變為 ((2n-1) pi / 2L)^2,特徵函數變為 sin((2n-1) pi x / 2L)——同一個微分方程,卻得到不同的階梯、不同的形狀。這正是為什麼邊值問題與初值問題是兩種不同的生物。
有兩個規律確實在所有標準情形中存活下來,值得你信賴。第一,特徵值構成一個遞增、向無窮進軍的數列 lambda_1 < lambda_2 < lambda_3 < ...,從不擠成一團,也從不回頭下降。第二,第 n 個特徵函數在內部恰好有 n-1 個零點——每往上爬一階就多擺盪一次。第二件事絕非偶然;它正是你將在下一篇導引中按名認識的振盪定理的內容,而它讓你只要數一數節點,就能對特徵函數做合理性檢查。
為什麼這值得在意:這些形狀構成一組基底
若只到找出一道特殊函數的階梯為止,那不過是樁奇聞。但它不止於此,而這裡正是讓整個階梯值得攀登的回報。特徵函數 sin(n pi x / L) 是彼此正交的:把其中兩個不同的相乘、在 [0, L] 上積分,你會剛好得到零。它們的表現就像互相垂直的坐標軸——只是身處一個「點」皆為整個函數的空間裡。那份正交性正是讓你能把它們當作一套坐標系的性質,也是後兩篇導引中一切事物的種子。
正交的坐標軸,正是你把區間上任何合理的函數 f(x) 寫成這些基本形狀的加權和所需要的,f(x) = c_1 sin(pi x / L) + c_2 sin(2 pi x / L) + ...,並且能乾淨地讀出每一個係數——這就是特徵函數展開,而在這個特定情形下,它就是傅立葉正弦級數。這也是為什麼特徵值問題是通往分離變數法的橋梁:當你把熱方程或波動方程拆成空間乘以時間時,空間因子恰好落到這個問題上,特徵函數成為基石般的模態,而每個模態都各自獨立地隨時間演化。你找到的那道離散階梯,按字面意思說,就是系統各個自然模態的清單。
所以本篇導引是整個階梯的樞紐。你身後坐著那個赤裸的邊值問題及其平凡解;你前方則躺著斯圖姆-劉維爾理論,它將解釋「為什麼」特徵值是實數、為什麼階梯一路爬向無窮、以及為什麼特徵函數總是正交的——這些承諾,我們此處只在一個幸運的範例上嚐了一口。請帶走那個能把這一切組織起來的單一圖像:一個微分算子,就像一個矩陣,擁有它僅僅重新縮放的特殊輸入,而在邊界處,那些特殊輸入排成一道離散、正交的形狀階梯。