迴歸就是投影
最小二乘迴歸擬合 y ≈ X b。由於 X b 只能落在 X 的行空間裡,我們能做到的最好就是把 y 正交投影到該子空間上。令殘差 y - X b 與每一行正交,便得到正規方程 X^T X b = X^T y。這正是第一卷的幾何,如今戴上了資料科學的帽子。
卡爾曼濾波器:動力系統遇上最小二乘
把第 4 篇與第 5 篇融合。卡爾曼濾波器追蹤一個服從線性動力系統 x_{t+1} = A x_t + 雜訊 的狀態,而你只能看到帶雜訊的測量 z_t = H x_t + 雜訊。每一步先用 A 推進狀態來做預測,再朝新測量做一次最小二乘式的修正,權重取決於你對各資訊源的信任程度。
- 預測:x_pred = A x_est,並按過程雜訊放大不確定度(共變異數)。
- 比較:殘差 = z - H x_pred(測量有多出乎意料)。
- 修正:x_est = x_pred + K * 殘差,其中卡爾曼增益 K 是最小二乘意義下最優的混合權重。
DFT 不過是一次基變換
離散傅立葉變換聽起來像分析學,其實是純粹的線性代數:它把訊號改寫到複正弦基下。DFT 矩陣 F 是(按比例縮放的)么正矩陣——它的各行標準正交——所以正變換與逆變換不過是同一次基變換的來與回,不丟失任何資訊。
終極回報:四個問題,一套工具
退後一步看,整條主線就是三招在不同舞台上的演出。特徵向量尋找穩態與穩定性——PageRank、馬可夫鏈、動力系統。投影 / 低秩尋找最佳的簡潔概括——PCA、迴歸、推薦系統、嵌入。基變換挑選讓問題變簡單的座標——傅立葉、譜聚類、對角化。
這就是第二卷的全部承諾化為具體:你在第一門課上抽象證明過的那一小撮定理,正是搜尋、推薦、網路、訊號處理與控制背後運轉著的引擎。把這套工具學一次;從此處處認得它。