第一卷遺留的伏筆
第一卷把點積當作一個公式:u . v = u_1 v_1 + ... + u_n v_n。由它你讀出範數 ||v|| = sqrt(v . v)、向量間的夾角以及正交性。但綁定到某一組基的公式掩蓋了真正要緊的東西。第二卷要問:是哪些性質讓點積如此有用,我們能否只保留這些性質?
實向量空間 V 上的內積是一個映射 <u, v>,把兩個向量送到一個純量,滿足三條公理:對稱性(<u, v> = <v, u>)、對第一個變量的線性性,以及正定性(v != 0 時 <v, v> > 0)。你鍾愛的關於點積的每一條事實,都僅由這三行推出。
為何複純量需要共軛
在 C 上,天真的照搬會失敗。若仍取 <v, v> = sum v_k^2,令 v = (i, 0),便得 i^2 = -1 < 0——一個負長度。補救之道是對一側取共軛:<u, v> = sum u_k * conj(v_k)。如今 <v, v> = sum |v_k|^2 >= 0 重新成立。這就給出複(埃爾米特)內積。
代價是:內積不再對稱,而是共軛對稱,<u, v> = conj(<v, u>);它對第一變量線性,但對第二變量共軛線性:<u, c*v> = conj(c) <u, v>。一個變量線性、另一個變量共軛線性的形式,叫做半雙線性形式——拉丁文意為「一倍半」線性。
超越 R^n 的內積
這種抽象之所以划算,是因為公理在根本不是列向量的空間上同樣成立。在 [a, b] 上連續函數的空間裡,<f, g> = integral of f(x) g(x) dx 是一個真正的內積——它正是傅立葉級數背後的引擎。在矩陣上,<A, B> = trace(A^T B) 逐項度量「重疊」。
A weighted inner product on R^2 (still valid!):
<u, v> = 2*u1*v1 + 5*u2*v2
Check the axioms with the Gram matrix G = [2, 0; 0, 5]:
<u, v> = u^T G v
symmetric: G = G^T yes
positive-definite: 2 > 0 and 5 > 0 yes (eigenvalues of G positive)
Same vectors, different geometry: the "unit circle"
{ v : <v,v> = 1 } is now an ellipse 2*x^2 + 5*y^2 = 1.最後這個例子是一般性的:給定任意一組基,數 G_ij = <e_i, e_j> 構成格拉姆矩陣,而 <u, v> = u座標^T G v座標。有限維空間上的一個內積,等同於一個對稱(在 C 上為埃爾米特)正定矩陣的數據。點積只是 G = I 這一特例。