估計本徵值：瑞利商

為什麼我們根本需要一個估計

在本階梯走到這裡，你已從幾個側面見過了斯圖姆–劉維爾問題：一個寫成自伴形式的算子 L、一個權函數 w(x)，以及一串實的、離散的、向無窮邁去的本徵值 lambda_1 < lambda_2 < lambda_3 < ...，每個本徵值都帶著自己的本徵函數。這些本徵值正是關鍵所在：在物理上它們就是振動弦的固有頻率的平方、量子粒子的能階、柱的屈曲載荷。但這份指南要正面直擊的、令人不安的事實是——對幾乎任何真實問題，你都無法把本徵值寫成閉形式。弦是非均勻的，柱是漸細的，勢是疙疙瘩瘩的，而精確的譜根本拿不到手。

於是我們以恰到好處的方式放低目標。我們往往並不需要全部本徵值——我們要的是最低的那個 lambda_1，因為它主宰著最慢、最易激發、在物理上最占主導的模式：鼓的基音、原子的基態能量、柱首次屈曲的載荷。而我們也並不總需要把它算到十位數——我們要的是一個可信的估計，最好還附帶一條關於它落在真值哪一側的保證。前方那個了不起的事實是：單單一個商，就能精確地交付這一切。

能量商，以及它記得什麼

對象在此。對由 p(x)、q(x) 與權函數 w(x) 構成的斯圖姆–劉維爾算子，試探函數 u(x)——任何滿足邊界條件的合理函數——的瑞利商是 R[u] =（integral of [p (u')^2 - q u^2] dx）/（integral of w u^2 dx），兩個積分都取遍整個區間。別被符號嚇住，按物理去讀它。分子是一種能量：p (u')^2 是你把系統變形成形狀 u 時所儲存的彎曲或拉伸能（在斜率 u' 陡峭處它就大），而 -q u^2 是一項勢能貢獻。分母是 u 的一種帶權大小，是以自然權重 w 度量的範數。所以 R[u] 實實在在就是：儲存的能量，除以做儲存的那點東西的多少——一種單位帶權振幅上的能量。

為何偏是這個比值？因為它就是喬裝的本徵值。設想你幸運地把恰好的第 n 個本徵函數 y_n 餵給它，而 y_n 滿足 L y_n = lambda_n w y_n。把這個方程乘以 y_n 並積分，再用分部積分把導數挪到另一個因子上——邊界項恰好消失，正因為 y_n 滿足邊界條件，這正是自伴結構發揮作用之處。剩下的恰好是 R[y_n] = lambda_n。當被餵以真正的本徵函數時，這個商並非近似本徵值；它分毫不差地把它還回來。瑞利商把譜記得一清二楚。

極小原理：lambda_1 是地板

現在是核心，即最低本徵值的變分刻畫：在所有容許的試探函數 u 中，瑞利商恰在 u 等於基態本徵函數 y_1 時取到最小，且其最小值就是 lambda_1。用符號寫，lambda_1 = min over u of R[u]。本徵值問題悄然變成了一個極小化問題——而把單單一個數在一族形狀上極小化，是我們懂得如何近似攻克的，反之精確求解那個微分方程我們卻常常做不到。

這塊地板從何而來？回想本階梯前面那個深刻的事實：本徵函數構成一族完備、正交的函數，於是任意容許的 u 都能寫成疊加 u = c_1 y_1 + c_2 y_2 + c_3 y_3 + ...——一個以本徵函數為基的廣義傅里葉級數。把這個展開代入 R[u]。由於 y_n 帶權 w 正交，所有交叉項消失，商坍縮成一個乾淨的加權平均：R[u] =（lambda_1 c_1^2 + lambda_2 c_2^2 + lambda_3 c_3^2 + ...）/（c_1^2 + c_2^2 + c_3^2 + ...），其中我已把每個 y_n 的帶權範數吸收進 c_n。把它讀作一個質心：它是諸本徵值 lambda_n 的平均，按你的試探形狀含有多少各模式來加權。

整條定理就從這一行掉出來。一組數 lambda_1, lambda_2, lambda_3, ... 的平均——它們全都不小於 lambda_1，因為 lambda_1 是最小的——絕不可能掉到 lambda_1 之下。所以對每一個試探函數，R[u] 都大於或等於 lambda_1，而取等恰恰發生在全部權重都壓在第一個模式上時，即 c_2 = c_3 = ... = 0、u 是 y_1 的倍數之時。這就是極小原理，證明它所憑藉的，不過是「平均不可能小於它最小的成分」。最低本徵值是瑞利商的地板，而基態正是坐在地板上的那個形狀。

為什麼粗糙的猜測也好得出奇

下面這條性質，使該方法不只是成立，而是近乎魔法。在真實基態附近，瑞利商是駐定的——平坦得像一道平滑山谷的谷底。設你的猜測是真本徵函數加一個小誤差，u = y_1 + epsilon h，其中 epsilon 極小。把它推過加權平均公式：誤差 h 注入了少量的高階模式，但它對 R[u] 的每一份貢獻都是平方地進入的。形狀誤差是 epsilon 的一階，而本徵值誤差卻是二階的，量級為 epsilon^2。你猜的形狀有 10% 的誤差，只造成本徵值約 1% 的誤差。這正是你在第一卷遇到過的「極小處的平坦」：任何光滑函數在極小處其導數為零，於是一階的微擾讓你毫無損失，只有二階的曲率才被感覺到。

我們用最乾淨的情形把它落到實處。取區間 0 到 1 上的 y'' + lambda y = 0、y(0) = y(1) = 0——兩端夾緊的撥弦。這裡 p = 1，q = 0，w = 1。精確答案你已從前面指南的正弦級數知道：lambda_1 = pi^2 = 9.8696，本徵函數為 sin(pi x)。現在假裝你並不知道這個，只是猜一條最簡單、在兩端為零、中間鼓起的曲線：拋物線 u = x(1 - x)。分子一個積分，分母一個積分，便大功告成。

Problem:  y'' + lambda y = 0,  y(0) = y(1) = 0   (p=1, q=0, w=1)
Exact:    lambda_1 = pi^2 = 9.8696...   ,  y_1 = sin(pi x)

Trial shape (zero at both ends, bulges in the middle):
    u = x(1 - x)        u' = 1 - 2x

Numerator   = integral_0^1 (u')^2 dx = integral_0^1 (1 - 2x)^2 dx = 1/3
Denominator = integral_0^1  u^2  dx = integral_0^1 [x(1-x)]^2 dx = 1/30

    R[u] = (1/3) / (1/30) = 10

Compare:  10  vs  pi^2 = 9.8696   ->  +1.3% , and ABOVE the truth.

一行的拋物線把基本本徵值只高估了 1.3%——而極小原理保證這個估計落在 pi^2 之上，絕不在其下。

停下來體會這個結果。拋物線顯然不是正弦波——它頂上太尖，它的二階導是個常數而非振盪——可 R[u] = 10 與精確的 pi^2 = 9.8696 之差，僅僅一個百分點出頭。這正是二階駐定在起作用：一個在肉眼看來大致對的形狀，給出一個在小數點意義上精確的本徵值。而我們是白白得到它的，只用了兩個初等積分，沒有解任何微分方程。

把原理變成一套流程

單條拋物線只是一次性的估計。要做得更好，不要只猜一次——猜一整族，讓極小原理替你挑出最好的成員。把試探函數寫成帶幾個自由旋鈕的形式，u = a_1 phi_1 + a_2 phi_2 + ... + a_N phi_N，其中 phi_k 是選定的基形狀（每個都滿足邊界條件），a_k 是你可調的數。於是 R[u] 變成係數的一個普通函數，「在所有 u 上極小化」就變成了「在諸 a_k 上極小化」——一個有限而具體的優化。這就是瑞利–里茨方法，原理背後那台實用的引擎。

選 N 個各自滿足邊界條件的試探形狀 phi_1, ..., phi_N，構造帶未知係數的 u = a_1 phi_1 + ... + a_N phi_N。
搭建剛度陣 A（每對 phi_i 與 phi_j 之間的分子積分）和質量陣 B（分母帶權積分），使分子為 a 的轉置 A a、分母為 a 的轉置 B a。
令 R 的梯度為零，把極小化化為廣義矩陣本徵值問題 A a = mu B a——變分法問題就此變成了線性代數。
最小的矩陣本徵值 mu_1 就是你對 lambda_1 的估計；加入更多或更好的基形狀只會把估計單調地往下壓，趨向真值。

誠實的邊界，以及更高的模式

對這條保證覆蓋什麼、不覆蓋什麼，要看得清楚。乾淨的極小原理給出 lambda_1 的一個上界，而且只針對 lambda_1。它總是高估——你知道你的數偏大，絕不會偏小，這本身很有用（在量子力學中這就是著名的變分原理：所算的基態能量絕不會低於真實的基態能量）。但它不自動給你下界，所以「我高出多少」這個問題，方法本身並不回答；那需要額外的、更難的估計。而這種單側性是本性使然，不是一個你靠猜得更好就能修掉的筆誤。

那 lambda_2、lambda_3 乃至更高呢？同一台機器夠得到它們，只多一條規則。回想加權平均的圖景：R[u] 會被試探函數所攜帶的任何 lambda_1 成分往下拖。所以要估計第二個本徵值，就把試探函數限制為與基態正交——強令 c_1 = 0，把最低模式從平均中移除——再在這個受限集合上極小化 R[u]，就給出 lambda_2 的一個上界。敲掉前兩個模式，你就界定 lambda_3，如此沿階梯向上。（更俐落、無需假設的版本是 Courant–Fischer 極小極大刻畫，它夠到 lambda_n 而不必先握有前面的本徵函數。）

最後一道值得直說的護欄。整條極小原理仰賴斯圖姆–劉維爾結構在場——一個自伴算子、恰當的邊界條件、一個正的權函數 w。正是它使本徵值為實且有下界，提供了證明所憑藉的正交完備基，並釘死了分子的符號。把這些前提抽掉（一個非自伴算子、一個變號的權），那條令人安心的「永遠從上方給出上界」就可能失效。瑞利商不是萬能的神諭；它是你擁有一個貨真價實的斯圖姆–劉維爾問題所掙得的、確切的回報——而正如本階梯通篇所論，那恰恰是傅里葉、勒讓德與貝塞爾展開共同棲居之地。