为什么粗体字母的记法走不远
欢迎来到张量分析的第一级。前面关于向量场、梯度、散度与旋度的几篇向导,给了你一台强大的机器——但那里每一条公式都悄悄假设了平直、方正的笛卡尔坐标。一旦地面弯曲,或你换成极坐标、球坐标,那些整洁的公式便长出额外的项,而粗体箭头记法 v 也不再告诉你所需要知道的事。本级的承诺是在弯曲曲面上、乃至弯曲时空中做微积分;要兑现这个承诺,你首先需要一种诚实到能经受坐标变换的记法。那就是[[calc-index-notation|指标记法]]。
其想法是:不再把向量的内部藏进单独一个粗体字母,而是把它的分量大声地命名出来。不写 v,而写 v^i,意思是「第 i 个分量」,其中 i 取遍 1, 2, ..., n。矩阵变成 A^i_j;更精巧的对象只是长出更多指标,如 T^{ij}_k。于是张量分析的整门手艺,便是按几条严格规则推动这些带指标的符号——而一旦这些规则在你手中,弯曲空间的代数几乎变成机械操作,这恰是当几何本身已经很难时你所盼望的那份轻松。
在楼上与在楼下:逆变与协变
为什么指标的位置很重要——为什么 v^i(指标在上)与 v_i(指标在下)是不同的物种?因为给向量附上数,确实有两种自然方式,在斜的或弯曲的标架中它们并不一致。[[contravariant-and-covariant-components|上指标]]标记逆变分量:你要叠多少个各基箭头才能拼出该向量——这是配位移、速度、普通箭头的读数。下指标标记协变分量:向量投到各基方向上的垂直影子——这是配梯度、配等值面的读数。这些名字听来神秘,描述的却很朴素:在坐标变换下,这两类数朝相反的方向移动。
下面这个心象能把「逆」字钉牢。设你把尺缩小——把每个基向量的长度减半。世界中的箭头并未改变,可要描述它,你如今需要两倍多的基单位,于是逆变分量翻倍。分量与基反向而动:基缩小,数变大。这就是逆变。而像梯度这样的协变量则相反——它的下指标分量与基同向缩放,故称「协」。回想第一卷:梯度的各项是偏导数 df/dx^i;偏导数把它的坐标带在下方,这正是梯度天生带一个下指标、活在协变之中的深层缘由。
在普通的正交归一笛卡尔标架中,两类数恰好重合——v^i 与 v_i 持有相同的值——这正是你最初的课程从不费心区分它们的原因,也难怪你会以为上下不过是装饰。它们不是装饰。一旦基非正交归一或随位置而变(极坐标、球坐标、一张弯曲曲面),两种读数便分道扬镳,把它们混淆就会给出错误公式。在上与下之间翻译的词典是[[metric-tensor|度规张量]] g_{ij},而升降指标的操作 v_i = g_{ij} v^j,是下一篇向导的事;眼下只需记住:上与下是同一支箭头的两副面孔。
爱因斯坦的一行规则
现在轮到核心。物理里满是长得一模一样的求和。点积是 u1 v1 + u2 v2 + u3 v3。矩阵乘向量的分量是对 k 求和的 A(i,k) 乘 x(k)。进入四维与弯曲空间,这些求和号便层出不穷,把页面塞满。[[einstein-summation-convention|爱因斯坦求和约定]]是一条记账规则,让你几乎能抹去每一个 sigma。据说爱因斯坦曾打趣,说自己借此对数学作出了最大的贡献——而这玩笑只说对了一半,因为这条规则真的在做事。
规则恰恰是这样:只要某个指标在同一项中出现两次——一次在上、一次在下——就自动对它在其整个取值范围内求和,无需写出 sigma。于是 a^i b_i 暗中表示 a^1 b_1 + a^2 b_2 + ... + a^n b_n。像这样被求和掉的重复指标称为哑指标(或求和指标),它的名字根本无关紧要:a^i b_i 与 a^k b_k 表示的是同一个数,所以你可以自由地给哑指标改名以避免冲突。在一项中只出现一次的指标是自由指标;它标明你指的是哪个分量,且必须在每一项、方程两边都以相同的上下位置出现。
READING AN INDEXED EXPRESSION
a^i b_i ( n = 3 ) -> a^1 b_1 + a^2 b_2 + a^3 b_3 ( one hidden sum )
i is a DUMMY index : up once, down once, summed, name irrelevant
a^i b_i = a^k b_k = a^m b_m ( all the same number )
In c^i = A^i_j x^j :
j appears up-and-down -> DUMMY (summed: matrix times vector)
i appears once each side -> FREE (labels the 3 components of c)
ds^2 = g_{ij} dx^i dx^j -> TWO dummy pairs (i and j)
a double sum: 9 terms in 3-D, written as 4 symbols
INDEX-BALANCE CHECK (do this on every line):
free indices on the LEFT must match free indices on the RIGHT,
same names, same up/down slots. If they don't, you slipped.两个粘合符号:delta 与 epsilon
两个特殊符号把上面的规则变成一套能用的代数。第一个是克罗内克 delta,delta^i_j,定义为 i = j 时取 1、否则取 0——它不过是带上指标的单位矩阵 [1, 0; 0, 1]。它的活儿是改名与缩并:在像 delta^i_j v^j 这样的求和里,delta 只有当 j 等于 i 时才非零,于是整个求和塌缩成 v^i。换言之,delta^i_j 像一个「替换算子」,专门追捕一个哑指标并把它替换掉。每当计算里冒出一个缠进求和的克罗内克 delta,你通常能当场化简,让它吞掉一个哑指标。
第二个是列维-奇维塔符号 epsilon_{ijk},对 (1, 2, 3) 的偶置换取 +1,奇置换取 -1,任意两个指标相等时取 0。这个小小的反对称对象,正是编码叉积与行列式的那一个。你在本卷前面遇到的叉积 nabla cross F,写成分量便是 c^i = epsilon^{ijk} a_j b_k——留意指标平衡:i 是唯一的自由指标,标记输出的三个分量,而 j 与 k 各是被求和掉的哑指标对。3 乘 3 矩阵的行列式同样是单个 epsilon 缩并。于是这两个符号之间便囊括了恒等、互换、旋转与定向——线性代数的全部词汇,打包进 delta 与 epsilon。
缩并、自由指标,以及它换来什么
整套记法里最重要的一步动作是缩并:把一个上指标与一个同名的下指标配对并求和,如 v^i w_i。这不是闲置的简写——它恰是构造与坐标无关的量的那个操作。因为上指标按坐标变换的雅可比变换、下指标按逆雅可比变换,这两个变换因子互为逆元;把它们缩并,两个因子恰好相消,存活下来的是一个真正的几何标量,每个观察者、在每个标架中都一致认同。点积 v^i w_i 是最干净的例子:一个数,与标架无关,从单次缩并里诞生。
这也是这套记法作为张量语言而立功之处。一个真正的[[tensor-transformation-law|张量方程]],是写成「张量 = 张量」、两边自由指标相同且处于相同上下位置的方程。变换律于是保证一件了不起的事:这样的方程若在一个坐标系成立,便同时在每个坐标系成立——单次推导一举确立一条在所有标架中都成立的自然律。这就是广义协变原理,也是相对论、连续介质力学与电磁学全都这样书写的缘由。但有一处界限要诚实:带有指标并不使一个对象成为张量。你很快会遇到的联络系数(克里斯托费尔符号)带有指标,却不满足变换律,这正是为什么张量的偏导数本身不是张量、协变导数不得不被发明出来。
- 把每个分量都写成带名字的指标,上指标配逆变槽(箭头,v^i),下指标配协变槽(梯度,w_i)。位置是信息,不是装饰。
- 找出哑指标对——每个一上一下出现一次的指标——并按爱因斯坦约定把它们读作隐藏的求和;给任何会冲突的哑指标改名。
- 做指标平衡校验:左右两边的自由指标必须在名字与上下位置上一致。不匹配,或任何指标出现三次,都意味着出错——继续之前先改正。
- 用 delta 来替换与化简,用 epsilon 来处理叉积与行列式,每当你想要一个所有坐标系都认同的量时,就把一个上指标与一个下指标缩并。