JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

Schur 與極分解:分解算子本身

LU 與 QR 把矩陣當作資料來分解。Schur 與極分解把它當作變換來分解——拆成旋轉與拉伸,或拆成一種總是存在的三角形式。

當對角化失敗時

第一卷講過對角化:當 A 有一整組特徵向量時,A = P D P^-1。但許多矩陣是*虧損的*——它們沒有足夠的特徵向量,於是不存在特徵基,P 不可逆。更糟的是,即便 P 存在,它也可能極度非正交,使分解在數值上毫無用處。我們需要一種*總是*存在、且只用良態正交因子的分解。

Schur 分解正是這種分解:每個方陣(在複數域上)都可寫成 A = Q T Q^*,其中 Q 是么正矩陣(實情形下為正交矩陣),T 是上三角矩陣。任何虧損都攔不住它。而因為 Q 是么正的,T 與 A 相似,故 T 與 A 共享特徵值——它們就明晃晃地排在 T 的對角線上。

讀懂 Schur 形式

T 的對角線給出每個特徵值,而完全不必去解特徵多項式——這正是嚴肅軟體求特徵值的方式,因為對大的 n 來說多項式求根的條件極差。上三角部分記錄了特徵向量在多大程度上偏離正交(當 A 為正規矩陣時它恰為零)。你還能重排 T 的對角線,把選定的一簇特徵值挪到頂部,這是不變子空間與控制論計算的基礎。

A = [ 1   1 ;        Q ~ orthonormal,   T = [ 3   * ;
      2   2 ]                                  0   0 ]
# A is defective-ish (rank 1), but Schur still exists.
# eigenvalues of A are 3 and 0 -> they appear on diag(T).
# the off-diagonal '*' encodes the non-orthogonality of A's eigenvectors.
# (The real Schur form keeps 2x2 blocks for complex-conjugate pairs.)
即便秩虧的 A 也有 Schur 形式;特徵值就排在 T 的對角線上。

極分解:旋轉乘以拉伸

極分解把任意方陣寫成 A = U P,其中 U 是正交矩陣(純旋轉/反射),P 是對稱半正定矩陣(沿正交軸的純非負拉伸)。它是把複數寫成 z = e^{i theta} r(相位乘以模長)的矩陣類比。這一分解把*算子所做的事*拆成「轉」與「縮」。

極分解與 SVD 是同一真理的兩種視角:若 A = W Sigma V^T 是 SVD,則 U = W V^T、P = V Sigma V^T。於是拉伸 P 的特徵值就是 A 的奇異值。工程師鍾愛極分解,因為 U 是與 A 最近的正交矩陣——它回答「與這個略有畸變的變換最接近的純旋轉是什麼?」,這正是圖形學、機器人學與晶體學中對測得旋轉做正交化的核心。