把向量的想法,拉伸到函数上
想象一个普通的三维向量。你之所以能毫不费力地写出 v = v_x i + v_y j + v_z k,是因为基向量 i、j、k 是正交的——两两互相垂直——于是每个分量都和其他分量解了耦。要求 v_x,你不必同时解三个方程;你只需取点积 v · i,而另外两个方向毫无贡献,因为它们垂直于 i。正交性正是把「求各个系数」变成「各取一次内积」的关键。整篇指南讲的就是一个论断:对函数也能享有同样的便利。
要谈论彼此垂直的函数,我们需要给函数定义一种「点积」。标准的做法是把对分量的有限求和换成在区间上的积分:两个函数 f 和 g 在 [a, b] 上的内积就是 从 a 到 b 的 f(x) g(x) w(x) dx 之积分,其中 w(x) 是一个固定的正值权函数,我们稍后解释。(暂时不管 w,把它读作 1 即可。)这是一个你早已会算的定积分;新的思维动作是把它的值当成一个单一的数,用来度量两个函数有多「对齐」。当这个积分等于零时,我们就说这两个函数是正交的。
为什么不同的本征值会逼出正交性
这就是问题的核心所在,而它是整卷书中最令人满足的短小论证之一。回想上一篇指南:一个斯图姆-刘维尔问题把算子写成它的自伴形式 (d/dx)(p y') + q y + lambda w y = 0。本征函数 y_m 和 y_n 各自带着自己的本征值 lambda_m 和 lambda_n 满足这个方程。诀窍是:把 y_m 的方程乘以 y_n,把 y_n 的方程乘以 y_m,相减,然后从 a 到 b 积分。几乎一切都抵消了——而幸存下来的,是一个几乎直接把结果递到你手上的恒等式。
Two eigenpairs: (p y_m')' + q y_m = -lambda_m w y_m
(p y_n')' + q y_n = -lambda_n w y_n
multiply first by y_n, second by y_m, subtract, integrate a..b:
(lambda_m - lambda_n) INT_a^b y_m y_n w dx
= INT_a^b [ y_n (p y_m')' - y_m (p y_n')' ] dx
the right side is an exact derivative (Lagrange identity):
= [ p ( y_n y_m' - y_m y_n' ) ]_a^b (a boundary term)
self-adjoint boundary conditions ==> that boundary term = 0
==> (lambda_m - lambda_n) INT_a^b y_m y_n w dx = 0
lambda_m != lambda_n ==> INT_a^b y_m y_n w dx = 0 (orthogonal!)请慢慢读最后一行,因为它就是这段论证的点睛之笔。我们得到 (lambda_m - lambda_n) 乘以 integral of y_m y_n w dx = 0。如果两个本征值不同——lambda_m 不等于 lambda_n——那么前面那个因子非零,于是这个乘积要为零的唯一可能,就是那个积分本身为零。而那个积分为零,恰恰就是「y_m 与 y_n 在权函数意义下正交」这句话。没有谁去挑选本征函数让它们垂直;是自伴结构加上边界条件逼出了这一点。这就是本征函数正交性定理,而它是自动成立的。
两条诚实的脚注。其一,那个边界项只有在合适的边界条件下才消失——也就是斯图姆-刘维尔那一族(函数在端点钉为零、或它的斜率、或两者的混合、或周期性匹配)。换了不对的边界条件,幸存项未必抵消,正交性就可能失败;这条定理是货真价实地靠它的前提撑着的。其二,这段论证只解决了本征值互不相同的情形。倘若某个本征值由两个独立的本征函数共享,那个积分本身未必为零——但你总能用格拉姆-施密特正交化亲手把那有限个同伴弄成正交的,跟你给普通向量做的整理一模一样。
权函数不是可有可无的记账
回头看那段推导,注意权函数 w(x) 究竟是在哪里进来的:它是搭着方程里 lambda w y 那一项进来的,所以出现在正交积分里的正是 w,而不是光秃秃的乘积 y_m y_n。这就是带权正交性,而权函数是由方程规定的——你无权挑选它。当你把一个微分算子化成自伴形式时,乘在 lambda 上的那个因子就是权函数,而且只有在这个内积之下,这些本征函数才是彼此垂直的。
一对具体的例子能把这一点讲清楚。区间 [0, L] 上朴素的三角系 sin(n pi x / L) 来自 y'' + lambda y = 0,它的自伴形式权函数 w = 1;所以那些正弦在普通的、不带权的意义下就是正交的——也就是 sin(m……) sin(n……) 在一个周期上积分为零那个熟悉的事实。但勒让德多项式 P_n(x) 来自 (1 - x^2) y'' - 2x y' + n(n+1) y = 0,它本身就以 ((1 - x^2) y')' + n(n+1) y = 0 的形式自伴,权函数同样是 w = 1——而贝塞尔函数带着权函数 w(x) = x 登场,埃尔米特权函数则是 e^{-x^2}。若你不带它们的权函数去验证埃尔米特或贝塞尔的正交性,那个积分根本不会消失;放进正确的 w,它就恰好归零。
完备性:既正交,又足够多
光有正交性还不够,而把原因说清楚是值得的。单个向量 i 与 y–z 平面里的一切都正交,但你没法只用 i 搭出一个一般的三维向量——你还需要 j 和 k 去张成其余部分。一组基必须既正交又完备:丰富到不漏掉任何东西。斯图姆-刘维尔理论那条深刻的姊妹定理说,本征函数恰恰就是这样的。本征函数的完备性保证了族 {y_n} 张成 [a, b] 上全部像样函数所在的整个空间——除了零函数,再没有别的函数能潜伏在「与它们全体都垂直」之处。
把正交性与完备性放在一起,你就有了一台配方机器。假设你想把某个目标函数 f 写成 f(x) = sum c_n y_n(x)。完备性许诺这个展开存在;正交性则毫不费力地把每个系数交到你手上。把两边都与某一个本征函数 y_m 取内积:在右边,除了 n = m 那一项,每一项积分都为零,因为其余各项都与它正交。整个无穷和坍缩成唯一的幸存者,于是掉出 c_m = (integral of f y_m w dx) / (integral of y_m^2 w dx)。这正是 v_x = v · i 的精确对应物,只不过换成了积分。
- 在 [a, b] 上解斯图姆-刘维尔问题,得到正交的本征函数 y_n 与权函数 w(x)。
- 用一次内积算出每个系数:c_n = (integral of f y_n w dx) / (integral of y_n^2 w dx)。分母不过是 y_n 的长度平方。
- 把各项拼成广义傅里叶级数 f(x) = sum c_n y_n(x);完备性保证它能重建 f(在均方意义下)。
完备性究竟换来了什么
完备性是本卷中每一种展开方法背后那位默默无闻的英雄。正因为本征函数是完备的,普通的三角傅里叶级数、勒让德级数、贝塞尔-傅里叶级数、埃尔米特展开,才全都是同一个想法换了身衣裳——每一个,都是某种几何恰好产生的那个斯图姆-刘维尔问题的广义傅里叶级数。完备性也正是分离变量法之所以能在热方程、波动方程、拉普拉斯方程上奏效的原因:你把初始数据按本征函数展开,让每个简单的模态各自独立演化,再叠加起来。倘若本征函数张不满整个空间,某些初始状态就无法表示,这个方法便会卡住。
完备性甚至附带一本能量账。对普通向量,勾股定理说 |v|^2 = v_x^2 + v_y^2 + v_z^2;整体的长度,等于它各垂直分量长度的平方和。它的函数版本就是帕塞瓦尔恒等式:integral of f^2 w dx = sum c_n^2 (integral of y_n^2 w dx)。f 的总「大小」等于它各个分量大小之和——而点睛之笔在于:完备性,恰恰就是把这条式子从不等式变成精确等式的那个条件。倘若本征函数漏掉了空间的一部分,右边就会偏小;取等号,意味着没有任何东西丢失。
为什么这是本卷的秘密引擎
退后一步,整片风景便归位了。每当本卷「把一个函数展开成正交的部分」——而它无时不在这样做——它所援引的,正是你刚刚看着被一步步赢得的那两条保证:正交性,它让各个系数解耦,于是每个系数都是单独一个积分;以及完备性,它许诺这些部分不漏掉任何东西。数学物理中那些具名的特殊函数并不是一群互不相干的奇珍异兽;它们是标准几何——区间、圆盘、球面——交到你手上的那些斯图姆-刘维尔问题的本征函数。掌握了这一套机制,你在真正的意义上,就一举理解了傅里叶、勒让德和贝塞尔。
还有一个珍视这套结构的理由:它让难题变得模块化。因为各个模态彼此正交,你可以一次只分析一个、再把答案加起来而互不干扰——这正是你在线性常微分方程里依赖过的那个叠加原理,如今作用在一整组函数基上。本阶梯接下来的几篇指南就让这台机器开工:把一个具体的边值问题化成它的本征函数,再看着任意的热或波的轮廓溶解成一个个各自按简单规律演化的模态。下游的一切,都立在此处证明的两个事实之上——不同的本征值彼此垂直,而本征函数合在一起什么也不漏。