估计本征值：瑞利商

为什么我们根本需要一个估计

在本阶梯走到这里，你已从几个侧面见过了斯图姆–刘维尔问题：一个写成自伴形式的算子 L、一个权函数 w(x)，以及一串实的、离散的、向无穷迈去的本征值 lambda_1 < lambda_2 < lambda_3 < ...，每个本征值都带着自己的本征函数。这些本征值正是关键所在：在物理上它们就是振动弦的固有频率的平方、量子粒子的能级、柱的屈曲载荷。但这份指南要正面直击的、令人不安的事实是——对几乎任何真实问题，你都无法把本征值写成闭形式。弦是非均匀的，柱是渐细的，势是疙疙瘩瘩的，而精确的谱根本拿不到手。

于是我们以恰到好处的方式放低目标。我们往往并不需要全部本征值——我们要的是最低的那个 lambda_1，因为它主宰着最慢、最易激发、在物理上最占主导的模式：鼓的基音、原子的基态能量、柱首次屈曲的载荷。而我们也并不总需要把它算到十位数——我们要的是一个可信的估计，最好还附带一条关于它落在真值哪一侧的保证。前方那个了不起的事实是：单单一个商，就能精确地交付这一切。

能量商，以及它记得什么

对象在此。对由 p(x)、q(x) 与权函数 w(x) 构成的斯图姆–刘维尔算子，试探函数 u(x)——任何满足边界条件的合理函数——的瑞利商是 R[u] =（integral of [p (u')^2 - q u^2] dx）/（integral of w u^2 dx），两个积分都取遍整个区间。别被符号吓住，按物理去读它。分子是一种能量：p (u')^2 是你把系统变形成形状 u 时所储存的弯曲或拉伸能（在斜率 u' 陡峭处它就大），而 -q u^2 是一项势能贡献。分母是 u 的一种带权大小，是以自然权重 w 度量的范数。所以 R[u] 实实在在就是：储存的能量，除以做储存的那点东西的多少——一种单位带权振幅上的能量。

为何偏是这个比值？因为它就是乔装的本征值。设想你幸运地把恰好的第 n 个本征函数 y_n 喂给它，而 y_n 满足 L y_n = lambda_n w y_n。把这个方程乘以 y_n 并积分，再用分部积分把导数挪到另一个因子上——边界项恰好消失，正因为 y_n 满足边界条件，这正是自伴结构发挥作用之处。剩下的恰好是 R[y_n] = lambda_n。当被喂以真正的本征函数时，这个商并非近似本征值；它分毫不差地把它还回来。瑞利商把谱记得一清二楚。

极小原理：lambda_1 是地板

现在是核心，即最低本征值的变分刻画：在所有容许的试探函数 u 中，瑞利商恰在 u 等于基态本征函数 y_1 时取到最小，且其最小值就是 lambda_1。用符号写，lambda_1 = min over u of R[u]。本征值问题悄然变成了一个极小化问题——而把单单一个数在一族形状上极小化，是我们懂得如何近似攻克的，反之精确求解那个微分方程我们却常常做不到。

这块地板从何而来？回想本阶梯前面那个深刻的事实：本征函数构成一族完备、正交的函数，于是任意容许的 u 都能写成叠加 u = c_1 y_1 + c_2 y_2 + c_3 y_3 + ...——一个以本征函数为基的广义傅里叶级数。把这个展开代入 R[u]。由于 y_n 带权 w 正交，所有交叉项消失，商坍缩成一个干净的加权平均：R[u] =（lambda_1 c_1^2 + lambda_2 c_2^2 + lambda_3 c_3^2 + ...）/（c_1^2 + c_2^2 + c_3^2 + ...），其中我已把每个 y_n 的带权范数吸收进 c_n。把它读作一个质心：它是诸本征值 lambda_n 的平均，按你的试探形状含有多少各模式来加权。

整条定理就从这一行掉出来。一组数 lambda_1, lambda_2, lambda_3, ... 的平均——它们全都不小于 lambda_1，因为 lambda_1 是最小的——绝不可能掉到 lambda_1 之下。所以对每一个试探函数，R[u] 都大于或等于 lambda_1，而取等恰恰发生在全部权重都压在第一个模式上时，即 c_2 = c_3 = ... = 0、u 是 y_1 的倍数之时。这就是极小原理，证明它所凭借的，不过是「平均不可能小于它最小的成分」。最低本征值是瑞利商的地板，而基态正是坐在地板上的那个形状。

为什么粗糙的猜测也好得出奇

下面这条性质，使该方法不只是成立，而是近乎魔法。在真实基态附近，瑞利商是驻定的——平坦得像一道平滑山谷的谷底。设你的猜测是真本征函数加一个小误差，u = y_1 + epsilon h，其中 epsilon 极小。把它推过加权平均公式：误差 h 注入了少量的高阶模式，但它对 R[u] 的每一份贡献都是平方地进入的。形状误差是 epsilon 的一阶，而本征值误差却是二阶的，量级为 epsilon^2。你猜的形状有 10% 的误差，只造成本征值约 1% 的误差。这正是你在第一卷遇到过的「极小处的平坦」：任何光滑函数在极小处其导数为零，于是一阶的微扰让你毫无损失，只有二阶的曲率才被感觉到。

我们用最干净的情形把它落到实处。取区间 0 到 1 上的 y'' + lambda y = 0、y(0) = y(1) = 0——两端夹紧的拨弦。这里 p = 1，q = 0，w = 1。精确答案你已从前面指南的正弦级数知道：lambda_1 = pi^2 = 9.8696，本征函数为 sin(pi x)。现在假装你并不知道这个，只是猜一条最简单、在两端为零、中间鼓起的曲线：抛物线 u = x(1 - x)。分子一个积分，分母一个积分，便大功告成。

Problem:  y'' + lambda y = 0,  y(0) = y(1) = 0   (p=1, q=0, w=1)
Exact:    lambda_1 = pi^2 = 9.8696...   ,  y_1 = sin(pi x)

Trial shape (zero at both ends, bulges in the middle):
    u = x(1 - x)        u' = 1 - 2x

Numerator   = integral_0^1 (u')^2 dx = integral_0^1 (1 - 2x)^2 dx = 1/3
Denominator = integral_0^1  u^2  dx = integral_0^1 [x(1-x)]^2 dx = 1/30

    R[u] = (1/3) / (1/30) = 10

Compare:  10  vs  pi^2 = 9.8696   ->  +1.3% , and ABOVE the truth.

一行的抛物线把基本本征值只高估了 1.3%——而极小原理保证这个估计落在 pi^2 之上，绝不在其下。

停下来体会这个结果。抛物线显然不是正弦波——它顶上太尖，它的二阶导是个常数而非振荡——可 R[u] = 10 与精确的 pi^2 = 9.8696 之差，仅仅一个百分点出头。这正是二阶驻定在起作用：一个在肉眼看来大致对的形状，给出一个在小数点意义上精确的本征值。而我们是白白得到它的，只用了两个初等积分，没有解任何微分方程。

把原理变成一套流程

单条抛物线只是一次性的估计。要做得更好，不要只猜一次——猜一整族，让极小原理替你挑出最好的成员。把试探函数写成带几个自由旋钮的形式，u = a_1 phi_1 + a_2 phi_2 + ... + a_N phi_N，其中 phi_k 是选定的基形状（每个都满足边界条件），a_k 是你可调的数。于是 R[u] 变成系数的一个普通函数，「在所有 u 上极小化」就变成了「在诸 a_k 上极小化」——一个有限而具体的优化。这就是瑞利–里茨方法，原理背后那台实用的引擎。

选 N 个各自满足边界条件的试探形状 phi_1, ..., phi_N，构造带未知系数的 u = a_1 phi_1 + ... + a_N phi_N。
搭建刚度阵 A（每对 phi_i 与 phi_j 之间的分子积分）和质量阵 B（分母带权积分），使分子为 a 的转置 A a、分母为 a 的转置 B a。
令 R 的梯度为零，把极小化化为广义矩阵本征值问题 A a = mu B a——变分法问题就此变成了线性代数。
最小的矩阵本征值 mu_1 就是你对 lambda_1 的估计；加入更多或更好的基形状只会把估计单调地往下压，趋向真值。

诚实的边界，以及更高的模式

对这条保证覆盖什么、不覆盖什么，要看得清楚。干净的极小原理给出 lambda_1 的一个上界，而且只针对 lambda_1。它总是高估——你知道你的数偏大，绝不会偏小，这本身很有用（在量子力学中这就是著名的变分原理：所算的基态能量绝不会低于真实的基态能量）。但它不自动给你下界，所以「我高出多少」这个问题，方法本身并不回答；那需要额外的、更难的估计。而这种单侧性是本性使然，不是一个你靠猜得更好就能修掉的笔误。

那 lambda_2、lambda_3 乃至更高呢？同一台机器够得到它们，只多一条规则。回想加权平均的图景：R[u] 会被试探函数所携带的任何 lambda_1 成分往下拖。所以要估计第二个本征值，就把试探函数限制为与基态正交——强令 c_1 = 0，把最低模式从平均中移除——再在这个受限集合上极小化 R[u]，就给出 lambda_2 的一个上界。敲掉前两个模式，你就界定 lambda_3，如此沿阶梯向上。（更利落、无需假设的版本是 Courant–Fischer 极小极大刻画，它够到 lambda_n 而不必先握有前面的本征函数。）

最后一道值得直说的护栏。整条极小原理仰赖斯图姆–刘维尔结构在场——一个自伴算子、恰当的边界条件、一个正的权函数 w。正是它使本征值为实且有下界，提供了证明所凭借的正交完备基，并钉死了分子的符号。把这些前提抽掉（一个非自伴算子、一个变号的权），那条令人安心的「永远从上方给出上界」就可能失效。瑞利商不是万能的神谕；它是你拥有一个货真价实的斯图姆–刘维尔问题所挣得的、确切的回报——而正如本阶梯通篇所论，那恰恰是傅里叶、勒让德与贝塞尔展开共同栖居之地。