JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

Schur 与极分解:分解算子本身

LU 与 QR 把矩阵当作数据来分解。Schur 与极分解把它当作变换来分解——拆成旋转与拉伸,或拆成一种总是存在的三角形式。

当对角化失败时

第一卷讲过对角化:当 A 有一整组特征向量时,A = P D P^-1。但许多矩阵是*亏损的*——它们没有足够的特征向量,于是不存在特征基,P 不可逆。更糟的是,即便 P 存在,它也可能极度非正交,使分解在数值上毫无用处。我们需要一种*总是*存在、且只用良态正交因子的分解。

Schur 分解正是这种分解:每个方阵(在复数域上)都可写成 A = Q T Q^*,其中 Q 是酉矩阵(实情形下为正交矩阵),T 是上三角矩阵。任何亏损都拦不住它。而因为 Q 是酉的,T 与 A 相似,故 T 与 A 共享特征值——它们就明晃晃地排在 T 的对角线上。

读懂 Schur 形式

T 的对角线给出每个特征值,而完全不必去解特征多项式——这正是严肃软件求特征值的方式,因为对大的 n 来说多项式求根的条件极差。上三角部分记录了特征向量在多大程度上偏离正交(当 A 为正规矩阵时它恰为零)。你还能重排 T 的对角线,把选定的一簇特征值挪到顶部,这是不变子空间与控制论计算的基础。

A = [ 1   1 ;        Q ~ orthonormal,   T = [ 3   * ;
      2   2 ]                                  0   0 ]
# A is defective-ish (rank 1), but Schur still exists.
# eigenvalues of A are 3 and 0 -> they appear on diag(T).
# the off-diagonal '*' encodes the non-orthogonality of A's eigenvectors.
# (The real Schur form keeps 2x2 blocks for complex-conjugate pairs.)
即便秩亏的 A 也有 Schur 形式;特征值就排在 T 的对角线上。

极分解:旋转乘以拉伸

极分解把任意方阵写成 A = U P,其中 U 是正交矩阵(纯旋转/反射),P 是对称半正定矩阵(沿正交轴的纯非负拉伸)。它是把复数写成 z = e^{i theta} r(相位乘以模长)的矩阵类比。这一分解把*算子所做的事*拆成「转」与「缩」。

极分解与 SVD 是同一真理的两种视角:若 A = W Sigma V^T 是 SVD,则 U = W V^T、P = V Sigma V^T。于是拉伸 P 的特征值就是 A 的奇异值。工程师钟爱极分解,因为 U 是与 A 最近的正交矩阵——它回答「与这个略有畸变的变换最接近的纯旋转是什么?」,这正是图形学、机器人学与晶体学中对测得旋转做正交化的核心。