从点积到抽象内积

第一卷遗留的伏笔

第一卷把点积当作一个公式：u . v = u_1 v_1 + ... + u_n v_n。由它你读出范数 ||v|| = sqrt(v . v)、向量间的夹角以及正交性。但绑定到某一组基的公式掩盖了真正要紧的东西。第二卷要问：是哪些性质让点积如此有用，我们能否只保留这些性质？

实向量空间 V 上的内积是一个映射 <u, v>，把两个向量送到一个标量，满足三条公理：对称性（<u, v> = <v, u>）、对第一个变量的线性性，以及正定性（v != 0 时 <v, v> > 0）。你钟爱的关于点积的每一条事实，都仅由这三行推出。

为何复标量需要共轭

在 C 上，天真的照搬会失败。若仍取 <v, v> = sum v_k^2，令 v = (i, 0)，便得 i^2 = -1 < 0——一个负长度。补救之道是对一侧取共轭：<u, v> = sum u_k * conj(v_k)。如今 <v, v> = sum |v_k|^2 >= 0 重新成立。这就给出复（埃尔米特）内积。

代价是：内积不再对称，而是共轭对称，<u, v> = conj(<v, u>)；它对第一变量线性，但对第二变量共轭线性：<u, c*v> = conj(c) <u, v>。一个变量线性、另一个变量共轭线性的形式，叫做半双线性形式——拉丁文意为“一倍半”线性。

超越 R^n 的内积

这种抽象之所以划算，是因为公理在根本不是列向量的空间上同样成立。在 [a, b] 上连续函数的空间里，<f, g> = integral of f(x) g(x) dx 是一个真正的内积——它正是傅里叶级数背后的引擎。在矩阵上，<A, B> = trace(A^T B) 逐项度量“重叠”。

A weighted inner product on R^2 (still valid!):

  <u, v> = 2*u1*v1 + 5*u2*v2

Check the axioms with the Gram matrix G = [2, 0; 0, 5]:
  <u, v> = u^T G v
  symmetric:        G = G^T            yes
  positive-definite: 2 > 0 and 5 > 0   yes  (eigenvalues of G positive)

Same vectors, different geometry: the "unit circle"
{ v : <v,v> = 1 }  is now an ellipse 2*x^2 + 5*y^2 = 1.

任何对称正定的格拉姆矩阵都定义一个合法的内积。

最后这个例子是一般性的：给定任意一组基，数 G_ij = <e_i, e_j> 构成格拉姆矩阵，而 <u, v> = u坐标^T G v坐标。有限维空间上的一个内积，等同于一个对称（在 C 上为埃尔米特）正定矩阵的数据。点积只是 G = I 这一特例。