為什麼我們根本需要一個估計
在本階梯走到這裡,你已從幾個側面見過了斯圖姆–劉維爾問題:一個寫成自伴形式的算子 L、一個權函數 w(x),以及一串實的、離散的、向無窮邁去的本徵值 lambda_1 < lambda_2 < lambda_3 < ...,每個本徵值都帶著自己的本徵函數。這些本徵值正是關鍵所在:在物理上它們就是振動弦的固有頻率的平方、量子粒子的能階、柱的屈曲載荷。但這份指南要正面直擊的、令人不安的事實是——對幾乎任何真實問題,你都無法把本徵值寫成閉形式。弦是非均勻的,柱是漸細的,勢是疙疙瘩瘩的,而精確的譜根本拿不到手。
於是我們以恰到好處的方式放低目標。我們往往並不需要全部本徵值——我們要的是最低的那個 lambda_1,因為它主宰著最慢、最易激發、在物理上最占主導的模式:鼓的基音、原子的基態能量、柱首次屈曲的載荷。而我們也並不總需要把它算到十位數——我們要的是一個可信的估計,最好還附帶一條關於它落在真值哪一側的保證。前方那個了不起的事實是:單單一個商,就能精確地交付這一切。
能量商,以及它記得什麼
對象在此。對由 p(x)、q(x) 與權函數 w(x) 構成的斯圖姆–劉維爾算子,試探函數 u(x)——任何滿足邊界條件的合理函數——的瑞利商是 R[u] =(integral of [p (u')^2 - q u^2] dx)/(integral of w u^2 dx),兩個積分都取遍整個區間。別被符號嚇住,按物理去讀它。分子是一種能量:p (u')^2 是你把系統變形成形狀 u 時所儲存的彎曲或拉伸能(在斜率 u' 陡峭處它就大),而 -q u^2 是一項勢能貢獻。分母是 u 的一種帶權大小,是以自然權重 w 度量的範數。所以 R[u] 實實在在就是:儲存的能量,除以做儲存的那點東西的多少——一種單位帶權振幅上的能量。
為何偏是這個比值?因為它就是喬裝的本徵值。設想你幸運地把恰好的第 n 個本徵函數 y_n 餵給它,而 y_n 滿足 L y_n = lambda_n w y_n。把這個方程乘以 y_n 並積分,再用分部積分把導數挪到另一個因子上——邊界項恰好消失,正因為 y_n 滿足邊界條件,這正是自伴結構發揮作用之處。剩下的恰好是 R[y_n] = lambda_n。當被餵以真正的本徵函數時,這個商並非近似本徵值;它分毫不差地把它還回來。瑞利商把譜記得一清二楚。
極小原理:lambda_1 是地板
現在是核心,即最低本徵值的變分刻畫:在所有容許的試探函數 u 中,瑞利商恰在 u 等於基態本徵函數 y_1 時取到最小,且其最小值就是 lambda_1。用符號寫,lambda_1 = min over u of R[u]。本徵值問題悄然變成了一個極小化問題——而把單單一個數在一族形狀上極小化,是我們懂得如何近似攻克的,反之精確求解那個微分方程我們卻常常做不到。
這塊地板從何而來?回想本階梯前面那個深刻的事實:本徵函數構成一族完備、正交的函數,於是任意容許的 u 都能寫成疊加 u = c_1 y_1 + c_2 y_2 + c_3 y_3 + ...——一個以本徵函數為基的廣義傅里葉級數。把這個展開代入 R[u]。由於 y_n 帶權 w 正交,所有交叉項消失,商坍縮成一個乾淨的加權平均:R[u] =(lambda_1 c_1^2 + lambda_2 c_2^2 + lambda_3 c_3^2 + ...)/(c_1^2 + c_2^2 + c_3^2 + ...),其中我已把每個 y_n 的帶權範數吸收進 c_n。把它讀作一個質心:它是諸本徵值 lambda_n 的平均,按你的試探形狀含有多少各模式來加權。
整條定理就從這一行掉出來。一組數 lambda_1, lambda_2, lambda_3, ... 的平均——它們全都不小於 lambda_1,因為 lambda_1 是最小的——絕不可能掉到 lambda_1 之下。所以對每一個試探函數,R[u] 都大於或等於 lambda_1,而取等恰恰發生在全部權重都壓在第一個模式上時,即 c_2 = c_3 = ... = 0、u 是 y_1 的倍數之時。這就是極小原理,證明它所憑藉的,不過是「平均不可能小於它最小的成分」。最低本徵值是瑞利商的地板,而基態正是坐在地板上的那個形狀。
為什麼粗糙的猜測也好得出奇
下面這條性質,使該方法不只是成立,而是近乎魔法。在真實基態附近,瑞利商是駐定的——平坦得像一道平滑山谷的谷底。設你的猜測是真本徵函數加一個小誤差,u = y_1 + epsilon h,其中 epsilon 極小。把它推過加權平均公式:誤差 h 注入了少量的高階模式,但它對 R[u] 的每一份貢獻都是平方地進入的。形狀誤差是 epsilon 的一階,而本徵值誤差卻是二階的,量級為 epsilon^2。你猜的形狀有 10% 的誤差,只造成本徵值約 1% 的誤差。這正是你在第一卷遇到過的「極小處的平坦」:任何光滑函數在極小處其導數為零,於是一階的微擾讓你毫無損失,只有二階的曲率才被感覺到。
我們用最乾淨的情形把它落到實處。取區間 0 到 1 上的 y'' + lambda y = 0、y(0) = y(1) = 0——兩端夾緊的撥弦。這裡 p = 1,q = 0,w = 1。精確答案你已從前面指南的正弦級數知道:lambda_1 = pi^2 = 9.8696,本徵函數為 sin(pi x)。現在假裝你並不知道這個,只是猜一條最簡單、在兩端為零、中間鼓起的曲線:拋物線 u = x(1 - x)。分子一個積分,分母一個積分,便大功告成。
Problem: y'' + lambda y = 0, y(0) = y(1) = 0 (p=1, q=0, w=1)
Exact: lambda_1 = pi^2 = 9.8696... , y_1 = sin(pi x)
Trial shape (zero at both ends, bulges in the middle):
u = x(1 - x) u' = 1 - 2x
Numerator = integral_0^1 (u')^2 dx = integral_0^1 (1 - 2x)^2 dx = 1/3
Denominator = integral_0^1 u^2 dx = integral_0^1 [x(1-x)]^2 dx = 1/30
R[u] = (1/3) / (1/30) = 10
Compare: 10 vs pi^2 = 9.8696 -> +1.3% , and ABOVE the truth.停下來體會這個結果。拋物線顯然不是正弦波——它頂上太尖,它的二階導是個常數而非振盪——可 R[u] = 10 與精確的 pi^2 = 9.8696 之差,僅僅一個百分點出頭。這正是二階駐定在起作用:一個在肉眼看來大致對的形狀,給出一個在小數點意義上精確的本徵值。而我們是白白得到它的,只用了兩個初等積分,沒有解任何微分方程。
把原理變成一套流程
單條拋物線只是一次性的估計。要做得更好,不要只猜一次——猜一整族,讓極小原理替你挑出最好的成員。把試探函數寫成帶幾個自由旋鈕的形式,u = a_1 phi_1 + a_2 phi_2 + ... + a_N phi_N,其中 phi_k 是選定的基形狀(每個都滿足邊界條件),a_k 是你可調的數。於是 R[u] 變成係數的一個普通函數,「在所有 u 上極小化」就變成了「在諸 a_k 上極小化」——一個有限而具體的優化。這就是瑞利–里茨方法,原理背後那台實用的引擎。
- 選 N 個各自滿足邊界條件的試探形狀 phi_1, ..., phi_N,構造帶未知係數的 u = a_1 phi_1 + ... + a_N phi_N。
- 搭建剛度陣 A(每對 phi_i 與 phi_j 之間的分子積分)和質量陣 B(分母帶權積分),使分子為 a 的轉置 A a、分母為 a 的轉置 B a。
- 令 R 的梯度為零,把極小化化為廣義矩陣本徵值問題 A a = mu B a——變分法問題就此變成了線性代數。
- 最小的矩陣本徵值 mu_1 就是你對 lambda_1 的估計;加入更多或更好的基形狀只會把估計單調地往下壓,趨向真值。
誠實的邊界,以及更高的模式
對這條保證覆蓋什麼、不覆蓋什麼,要看得清楚。乾淨的極小原理給出 lambda_1 的一個上界,而且只針對 lambda_1。它總是高估——你知道你的數偏大,絕不會偏小,這本身很有用(在量子力學中這就是著名的變分原理:所算的基態能量絕不會低於真實的基態能量)。但它不自動給你下界,所以「我高出多少」這個問題,方法本身並不回答;那需要額外的、更難的估計。而這種單側性是本性使然,不是一個你靠猜得更好就能修掉的筆誤。
那 lambda_2、lambda_3 乃至更高呢?同一台機器夠得到它們,只多一條規則。回想加權平均的圖景:R[u] 會被試探函數所攜帶的任何 lambda_1 成分往下拖。所以要估計第二個本徵值,就把試探函數限制為與基態正交——強令 c_1 = 0,把最低模式從平均中移除——再在這個受限集合上極小化 R[u],就給出 lambda_2 的一個上界。敲掉前兩個模式,你就界定 lambda_3,如此沿階梯向上。(更俐落、無需假設的版本是 Courant–Fischer 極小極大刻畫,它夠到 lambda_n 而不必先握有前面的本徵函數。)
最後一道值得直說的護欄。整條極小原理仰賴斯圖姆–劉維爾結構在場——一個自伴算子、恰當的邊界條件、一個正的權函數 w。正是它使本徵值為實且有下界,提供了證明所憑藉的正交完備基,並釘死了分子的符號。把這些前提抽掉(一個非自伴算子、一個變號的權),那條令人安心的「永遠從上方給出上界」就可能失效。瑞利商不是萬能的神諭;它是你擁有一個貨真價實的斯圖姆–劉維爾問題所掙得的、確切的回報——而正如本階梯通篇所論,那恰恰是傅里葉、勒讓德與貝塞爾展開共同棲居之地。