JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

从点积到抽象内积

在第一卷里,点积在 R^n 中赋予你长度与角度。现在我们把它提升为一套公理系统,可作用于任意向量空间——并发现复标量迫使我们引入一处“拧转”。

第一卷遗留的伏笔

第一卷把点积当作一个公式:u . v = u_1 v_1 + ... + u_n v_n。由它你读出范数 ||v|| = sqrt(v . v)、向量间的夹角以及正交性。但绑定到某一组基的公式掩盖了真正要紧的东西。第二卷要问:是哪些性质让点积如此有用,我们能否只保留这些性质?

向量空间 V 上的内积是一个映射 <u, v>,把两个向量送到一个标量,满足三条公理:对称性(<u, v> = <v, u>)、对第一个变量的线性性,以及正定性(v != 0 时 <v, v> > 0)。你钟爱的关于点积的每一条事实,都仅由这三行推出。

为何复标量需要共轭

在 C 上,天真的照搬会失败。若仍取 <v, v> = sum v_k^2,令 v = (i, 0),便得 i^2 = -1 < 0——一个负长度。补救之道是对一侧取共轭:<u, v> = sum u_k * conj(v_k)。如今 <v, v> = sum |v_k|^2 >= 0 重新成立。这就给出复(埃尔米特)内积

代价是:内积不再对称,而是共轭对称,<u, v> = conj(<v, u>);它对第一变量线性,但对第二变量共轭线性:<u, c*v> = conj(c) <u, v>。一个变量线性、另一个变量共轭线性的形式,叫做半双线性形式——拉丁文意为“一倍半”线性。

超越 R^n 的内积

这种抽象之所以划算,是因为公理在根本不是列向量的空间上同样成立。在 [a, b] 上连续函数的空间里,<f, g> = integral of f(x) g(x) dx 是一个真正的内积——它正是傅里叶级数背后的引擎。在矩阵上,<A, B> = trace(A^T B) 逐项度量“重叠”。

A weighted inner product on R^2 (still valid!):

  <u, v> = 2*u1*v1 + 5*u2*v2

Check the axioms with the Gram matrix G = [2, 0; 0, 5]:
  <u, v> = u^T G v
  symmetric:        G = G^T            yes
  positive-definite: 2 > 0 and 5 > 0   yes  (eigenvalues of G positive)

Same vectors, different geometry: the "unit circle"
{ v : <v,v> = 1 }  is now an ellipse 2*x^2 + 5*y^2 = 1.
任何对称正定的格拉姆矩阵都定义一个合法的内积。

最后这个例子是一般性的:给定任意一组基,数 G_ij = <e_i, e_j> 构成格拉姆矩阵,而 <u, v> = u坐标^T G v坐标。有限维空间上的一个内积,等同于一个对称(在 C 上为埃尔米特)正定矩阵的数据。点积只是 G = I 这一特例。