大规模特征值与预处理的回报

从幂迭代到 QR 算法

在第一卷中你通过分解特征多项式来求特征值——对 2x2 尚可，对 2000x2000 则毫无希望，而且出了名地病态。机器从不那样做。种子思想是幂方法：反复用 A 乘以一个向量再重新归一化，它会逼近主特征向量，因为那个方向增长最快。反幂迭代把幂方法应用于 (A - sigma I)^-1，收敛到最接近所选位移 sigma 的特征值——让你能瞄准任意想要的特征值。

一次性求所有特征值的主力是 QR 算法。反复做 A = Q R 分解（一个 QR 分解）再以相反次序重组 A_{new} = R Q。这个相似变换保持特征值不变，同时把矩阵推向上三角形式，其对角线随即一次性揭示每一个特征值。配以位移加速，QR 算法是二十世纪最重要的算法之一。

预处理：把问题弯成合适的形状

回想上一篇的结论：Krylov 收敛受条件数支配。预处理直接攻击这个数字。你不再求解 A x = b，而是求解等价系统 M^-1 A x = M^-1 b，其中 M 是一个预处理子，选得使得 (a) M^-1 A 的条件性远好于 A，且 (b) 对向量应用 M^-1 很便宜。两者兼得，一次一万步的求解就能降到三十步。

其技艺在于这两个目标之间的张力。完美的预处理子是 M = A，它使 M^-1 A = I 一步收敛——但应用 A^-1 恰恰是你解不了的那个问题。无用的预处理子是 M = I，便宜却毫无作用。每一个实用选择都介于二者之间：不完全 LU（分解 A 但丢弃大部分填充）、Jacobi/对角预处理子（A 的对角部分），或针对具体问题的多重网格或区域分解方案。

从零成本预处理子（Jacobi/对角缩放）开始，测量迭代次数。
若仍太慢，尝试只保留较大填充元的不完全 LU。
对结构化的偏微分方程问题，采用多重网格或区域分解预处理子。
在搭建成本与每步节省之间权衡——最佳的 M 最小化总时间，而非迭代次数。

回报：一切之下的静默引擎

退后一步，看看这五篇指南拼装出了什么。带选主元的后向稳定分解、Krylov 求解器 CG 与 GMRES、QR 算法这样的特征值引擎，全都被预处理磨利——这正是把第一卷纯净理论转化为有限机器上可信答案的机械装置。它对终端用户全然不可见，却无处不在。