为什么我们根本需要一个估计
在本阶梯走到这里,你已从几个侧面见过了斯图姆–刘维尔问题:一个写成自伴形式的算子 L、一个权函数 w(x),以及一串实的、离散的、向无穷迈去的本征值 lambda_1 < lambda_2 < lambda_3 < ...,每个本征值都带着自己的本征函数。这些本征值正是关键所在:在物理上它们就是振动弦的固有频率的平方、量子粒子的能级、柱的屈曲载荷。但这份指南要正面直击的、令人不安的事实是——对几乎任何真实问题,你都无法把本征值写成闭形式。弦是非均匀的,柱是渐细的,势是疙疙瘩瘩的,而精确的谱根本拿不到手。
于是我们以恰到好处的方式放低目标。我们往往并不需要全部本征值——我们要的是最低的那个 lambda_1,因为它主宰着最慢、最易激发、在物理上最占主导的模式:鼓的基音、原子的基态能量、柱首次屈曲的载荷。而我们也并不总需要把它算到十位数——我们要的是一个可信的估计,最好还附带一条关于它落在真值哪一侧的保证。前方那个了不起的事实是:单单一个商,就能精确地交付这一切。
能量商,以及它记得什么
对象在此。对由 p(x)、q(x) 与权函数 w(x) 构成的斯图姆–刘维尔算子,试探函数 u(x)——任何满足边界条件的合理函数——的瑞利商是 R[u] =(integral of [p (u')^2 - q u^2] dx)/(integral of w u^2 dx),两个积分都取遍整个区间。别被符号吓住,按物理去读它。分子是一种能量:p (u')^2 是你把系统变形成形状 u 时所储存的弯曲或拉伸能(在斜率 u' 陡峭处它就大),而 -q u^2 是一项势能贡献。分母是 u 的一种带权大小,是以自然权重 w 度量的范数。所以 R[u] 实实在在就是:储存的能量,除以做储存的那点东西的多少——一种单位带权振幅上的能量。
为何偏是这个比值?因为它就是乔装的本征值。设想你幸运地把恰好的第 n 个本征函数 y_n 喂给它,而 y_n 满足 L y_n = lambda_n w y_n。把这个方程乘以 y_n 并积分,再用分部积分把导数挪到另一个因子上——边界项恰好消失,正因为 y_n 满足边界条件,这正是自伴结构发挥作用之处。剩下的恰好是 R[y_n] = lambda_n。当被喂以真正的本征函数时,这个商并非近似本征值;它分毫不差地把它还回来。瑞利商把谱记得一清二楚。
极小原理:lambda_1 是地板
现在是核心,即最低本征值的变分刻画:在所有容许的试探函数 u 中,瑞利商恰在 u 等于基态本征函数 y_1 时取到最小,且其最小值就是 lambda_1。用符号写,lambda_1 = min over u of R[u]。本征值问题悄然变成了一个极小化问题——而把单单一个数在一族形状上极小化,是我们懂得如何近似攻克的,反之精确求解那个微分方程我们却常常做不到。
这块地板从何而来?回想本阶梯前面那个深刻的事实:本征函数构成一族完备、正交的函数,于是任意容许的 u 都能写成叠加 u = c_1 y_1 + c_2 y_2 + c_3 y_3 + ...——一个以本征函数为基的广义傅里叶级数。把这个展开代入 R[u]。由于 y_n 带权 w 正交,所有交叉项消失,商坍缩成一个干净的加权平均:R[u] =(lambda_1 c_1^2 + lambda_2 c_2^2 + lambda_3 c_3^2 + ...)/(c_1^2 + c_2^2 + c_3^2 + ...),其中我已把每个 y_n 的带权范数吸收进 c_n。把它读作一个质心:它是诸本征值 lambda_n 的平均,按你的试探形状含有多少各模式来加权。
整条定理就从这一行掉出来。一组数 lambda_1, lambda_2, lambda_3, ... 的平均——它们全都不小于 lambda_1,因为 lambda_1 是最小的——绝不可能掉到 lambda_1 之下。所以对每一个试探函数,R[u] 都大于或等于 lambda_1,而取等恰恰发生在全部权重都压在第一个模式上时,即 c_2 = c_3 = ... = 0、u 是 y_1 的倍数之时。这就是极小原理,证明它所凭借的,不过是「平均不可能小于它最小的成分」。最低本征值是瑞利商的地板,而基态正是坐在地板上的那个形状。
为什么粗糙的猜测也好得出奇
下面这条性质,使该方法不只是成立,而是近乎魔法。在真实基态附近,瑞利商是驻定的——平坦得像一道平滑山谷的谷底。设你的猜测是真本征函数加一个小误差,u = y_1 + epsilon h,其中 epsilon 极小。把它推过加权平均公式:误差 h 注入了少量的高阶模式,但它对 R[u] 的每一份贡献都是平方地进入的。形状误差是 epsilon 的一阶,而本征值误差却是二阶的,量级为 epsilon^2。你猜的形状有 10% 的误差,只造成本征值约 1% 的误差。这正是你在第一卷遇到过的「极小处的平坦」:任何光滑函数在极小处其导数为零,于是一阶的微扰让你毫无损失,只有二阶的曲率才被感觉到。
我们用最干净的情形把它落到实处。取区间 0 到 1 上的 y'' + lambda y = 0、y(0) = y(1) = 0——两端夹紧的拨弦。这里 p = 1,q = 0,w = 1。精确答案你已从前面指南的正弦级数知道:lambda_1 = pi^2 = 9.8696,本征函数为 sin(pi x)。现在假装你并不知道这个,只是猜一条最简单、在两端为零、中间鼓起的曲线:抛物线 u = x(1 - x)。分子一个积分,分母一个积分,便大功告成。
Problem: y'' + lambda y = 0, y(0) = y(1) = 0 (p=1, q=0, w=1)
Exact: lambda_1 = pi^2 = 9.8696... , y_1 = sin(pi x)
Trial shape (zero at both ends, bulges in the middle):
u = x(1 - x) u' = 1 - 2x
Numerator = integral_0^1 (u')^2 dx = integral_0^1 (1 - 2x)^2 dx = 1/3
Denominator = integral_0^1 u^2 dx = integral_0^1 [x(1-x)]^2 dx = 1/30
R[u] = (1/3) / (1/30) = 10
Compare: 10 vs pi^2 = 9.8696 -> +1.3% , and ABOVE the truth.停下来体会这个结果。抛物线显然不是正弦波——它顶上太尖,它的二阶导是个常数而非振荡——可 R[u] = 10 与精确的 pi^2 = 9.8696 之差,仅仅一个百分点出头。这正是二阶驻定在起作用:一个在肉眼看来大致对的形状,给出一个在小数点意义上精确的本征值。而我们是白白得到它的,只用了两个初等积分,没有解任何微分方程。
把原理变成一套流程
单条抛物线只是一次性的估计。要做得更好,不要只猜一次——猜一整族,让极小原理替你挑出最好的成员。把试探函数写成带几个自由旋钮的形式,u = a_1 phi_1 + a_2 phi_2 + ... + a_N phi_N,其中 phi_k 是选定的基形状(每个都满足边界条件),a_k 是你可调的数。于是 R[u] 变成系数的一个普通函数,「在所有 u 上极小化」就变成了「在诸 a_k 上极小化」——一个有限而具体的优化。这就是瑞利–里茨方法,原理背后那台实用的引擎。
- 选 N 个各自满足边界条件的试探形状 phi_1, ..., phi_N,构造带未知系数的 u = a_1 phi_1 + ... + a_N phi_N。
- 搭建刚度阵 A(每对 phi_i 与 phi_j 之间的分子积分)和质量阵 B(分母带权积分),使分子为 a 的转置 A a、分母为 a 的转置 B a。
- 令 R 的梯度为零,把极小化化为广义矩阵本征值问题 A a = mu B a——变分法问题就此变成了线性代数。
- 最小的矩阵本征值 mu_1 就是你对 lambda_1 的估计;加入更多或更好的基形状只会把估计单调地往下压,趋向真值。
诚实的边界,以及更高的模式
对这条保证覆盖什么、不覆盖什么,要看得清楚。干净的极小原理给出 lambda_1 的一个上界,而且只针对 lambda_1。它总是高估——你知道你的数偏大,绝不会偏小,这本身很有用(在量子力学中这就是著名的变分原理:所算的基态能量绝不会低于真实的基态能量)。但它不自动给你下界,所以「我高出多少」这个问题,方法本身并不回答;那需要额外的、更难的估计。而这种单侧性是本性使然,不是一个你靠猜得更好就能修掉的笔误。
那 lambda_2、lambda_3 乃至更高呢?同一台机器够得到它们,只多一条规则。回想加权平均的图景:R[u] 会被试探函数所携带的任何 lambda_1 成分往下拖。所以要估计第二个本征值,就把试探函数限制为与基态正交——强令 c_1 = 0,把最低模式从平均中移除——再在这个受限集合上极小化 R[u],就给出 lambda_2 的一个上界。敲掉前两个模式,你就界定 lambda_3,如此沿阶梯向上。(更利落、无需假设的版本是 Courant–Fischer 极小极大刻画,它够到 lambda_n 而不必先握有前面的本征函数。)
最后一道值得直说的护栏。整条极小原理仰赖斯图姆–刘维尔结构在场——一个自伴算子、恰当的边界条件、一个正的权函数 w。正是它使本征值为实且有下界,提供了证明所凭借的正交完备基,并钉死了分子的符号。把这些前提抽掉(一个非自伴算子、一个变号的权),那条令人安心的「永远从上方给出上界」就可能失效。瑞利商不是万能的神谕;它是你拥有一个货真价实的斯图姆–刘维尔问题所挣得的、确切的回报——而正如本阶梯通篇所论,那恰恰是傅里叶、勒让德与贝塞尔展开共同栖居之地。