對角不可能時退而求三角
對角化需要特徵基,並可能失敗。可三角化性要求更少:一組使 T 成上三角的基。在複數域上這總能成功,因為特徵多項式總有根,所以 T 總有至少一個特徵向量來開啟構造。
上三角在不變子空間的語言裡有乾淨的含義。T 在基 (b_1, ……, b_n) 下是上三角,當且僅當每個起始段 span{b_1, ……, b_k} 都是不變子空間。三角化無非就是構造一座嵌套的不變子空間塔。
旗:嵌套的不變子空間塔
旗是一條鏈 {0} = V_0 ⊂ V_1 ⊂ …… ⊂ V_n = V,且 dim V_k = k。當每個 V_k 都 T-不變時,稱其為 T-不變旗。三角化的全部內容就是:每個複算子都容許一面 T-不變旗,你甚至可以選得使相鄰基向量兩兩正交且單位化。
- 找出 T 的一個特徵向量 v_1(在 C 上有保證);令 V_1 = span{v_1},不變。
- 轉到商空間 V / V_1;那裡誘導的算子也有特徵向量,提升回來把 V_1 擴成不變的 V_2。
- 重複,每次把不變子空間增長一維,直到到達 V_n = V。
- 用 Gram-Schmidt 把所得的基正交單位化,得到么正版本——即 Schur 形。
Schur decomposition: for any complex matrix A there is a
UNITARY U (U* U = I) and an UPPER-TRIANGULAR matrix R with
A = U R U* ( U* = conjugate transpose of U )
R = [ l1 * * ;
0 l2 * ;
0 0 l3 ]
The diagonal entries l1, l2, l3 are exactly the eigenvalues of A
(counted with multiplicity). The columns of U are an orthonormal
basis realizing a T-invariant flag: span{u1} subset span{u1,u2} ...讀出譜
一旦有了 Schur 分解 A = U R U*,特徵值就只是 R 的對角線。么正的 U 意味著基變換數值穩定——無需求逆病態矩陣——這正是為什麼真實的特徵值演算法實際計算的是 Schur 形而非 Jordan 形。
回報:從單個算子到可交換族
旗的思想可以漂亮地推廣。若多個算子可交換,它們在每一級都共享一個公共不變子空間,於是它們能夠在同一組基下被同時化為上三角。這就是同時三角化,它是李理論的線性代數骨架。
退一步,縱觀整條軌道的弧線。我們從單條特徵直線出發,把它推廣為不變子空間,發現補可能失效,用廣義特徵向量與準素分解修補缺口,最終到達一條普適的結構定理:在 C 上每個算子都可三角化,每個可交換族都能一起三角化,而對角線總是向你展示譜。即便一個算子拒絕對角,分塊三角形式也能馴服它——這正是從原始特徵理論通往前方標準形的橋樑。