從點積到抽象內積

第一卷遺留的伏筆

第一卷把點積當作一個公式：u . v = u_1 v_1 + ... + u_n v_n。由它你讀出範數 ||v|| = sqrt(v . v)、向量間的夾角以及正交性。但綁定到某一組基的公式掩蓋了真正要緊的東西。第二卷要問：是哪些性質讓點積如此有用，我們能否只保留這些性質？

實向量空間 V 上的內積是一個映射 <u, v>，把兩個向量送到一個純量，滿足三條公理：對稱性（<u, v> = <v, u>）、對第一個變量的線性性，以及正定性（v != 0 時 <v, v> > 0）。你鍾愛的關於點積的每一條事實，都僅由這三行推出。

為何複純量需要共軛

在 C 上，天真的照搬會失敗。若仍取 <v, v> = sum v_k^2，令 v = (i, 0)，便得 i^2 = -1 < 0——一個負長度。補救之道是對一側取共軛：<u, v> = sum u_k * conj(v_k)。如今 <v, v> = sum |v_k|^2 >= 0 重新成立。這就給出複（埃爾米特）內積。

代價是：內積不再對稱，而是共軛對稱，<u, v> = conj(<v, u>)；它對第一變量線性，但對第二變量共軛線性：<u, c*v> = conj(c) <u, v>。一個變量線性、另一個變量共軛線性的形式，叫做半雙線性形式——拉丁文意為「一倍半」線性。

超越 R^n 的內積

這種抽象之所以划算，是因為公理在根本不是列向量的空間上同樣成立。在 [a, b] 上連續函數的空間裡，<f, g> = integral of f(x) g(x) dx 是一個真正的內積——它正是傅立葉級數背後的引擎。在矩陣上，<A, B> = trace(A^T B) 逐項度量「重疊」。

A weighted inner product on R^2 (still valid!):

  <u, v> = 2*u1*v1 + 5*u2*v2

Check the axioms with the Gram matrix G = [2, 0; 0, 5]:
  <u, v> = u^T G v
  symmetric:        G = G^T            yes
  positive-definite: 2 > 0 and 5 > 0   yes  (eigenvalues of G positive)

Same vectors, different geometry: the "unit circle"
{ v : <v,v> = 1 }  is now an ellipse 2*x^2 + 5*y^2 = 1.

任何對稱正定的格拉姆矩陣都定義一個合法的內積。

最後這個例子是一般性的：給定任意一組基，數 G_ij = <e_i, e_j> 構成格拉姆矩陣，而 <u, v> = u座標^T G v座標。有限維空間上的一個內積，等同於一個對稱（在 C 上為埃爾米特）正定矩陣的數據。點積只是 G = I 這一特例。