指标记法与求和约定

为什么粗体字母的记法走不远

欢迎来到张量分析的第一级。前面关于向量场、梯度、散度与旋度的几篇向导，给了你一台强大的机器——但那里每一条公式都悄悄假设了平直、方正的笛卡尔坐标。一旦地面弯曲，或你换成极坐标、球坐标，那些整洁的公式便长出额外的项，而粗体箭头记法 v 也不再告诉你所需要知道的事。本级的承诺是在弯曲曲面上、乃至弯曲时空中做微积分；要兑现这个承诺，你首先需要一种诚实到能经受坐标变换的记法。那就是[[calc-index-notation|指标记法]]。

其想法是：不再把向量的内部藏进单独一个粗体字母，而是把它的分量大声地命名出来。不写 v，而写 v^i，意思是「第 i 个分量」，其中 i 取遍 1, 2, ..., n。矩阵变成 A^i_j；更精巧的对象只是长出更多指标，如 T^{ij}_k。于是张量分析的整门手艺，便是按几条严格规则推动这些带指标的符号——而一旦这些规则在你手中，弯曲空间的代数几乎变成机械操作，这恰是当几何本身已经很难时你所盼望的那份轻松。

在楼上与在楼下：逆变与协变

为什么指标的位置很重要——为什么 v^i（指标在上）与 v_i（指标在下）是不同的物种？因为给向量附上数，确实有两种自然方式，在斜的或弯曲的标架中它们并不一致。[[contravariant-and-covariant-components|上指标]]标记逆变分量：你要叠多少个各基箭头才能拼出该向量——这是配位移、速度、普通箭头的读数。下指标标记协变分量：向量投到各基方向上的垂直影子——这是配梯度、配等值面的读数。这些名字听来神秘，描述的却很朴素：在坐标变换下，这两类数朝相反的方向移动。

下面这个心象能把「逆」字钉牢。设你把尺缩小——把每个基向量的长度减半。世界中的箭头并未改变，可要描述它，你如今需要两倍多的基单位，于是逆变分量翻倍。分量与基反向而动：基缩小，数变大。这就是逆变。而像梯度这样的协变量则相反——它的下指标分量与基同向缩放，故称「协」。回想第一卷：梯度的各项是偏导数 df/dx^i；偏导数把它的坐标带在下方，这正是梯度天生带一个下指标、活在协变之中的深层缘由。

在普通的正交归一笛卡尔标架中，两类数恰好重合——v^i 与 v_i 持有相同的值——这正是你最初的课程从不费心区分它们的原因，也难怪你会以为上下不过是装饰。它们不是装饰。一旦基非正交归一或随位置而变（极坐标、球坐标、一张弯曲曲面），两种读数便分道扬镳，把它们混淆就会给出错误公式。在上与下之间翻译的词典是[[metric-tensor|度规张量]] g_{ij}，而升降指标的操作 v_i = g_{ij} v^j，是下一篇向导的事；眼下只需记住：上与下是同一支箭头的两副面孔。

爱因斯坦的一行规则

现在轮到核心。物理里满是长得一模一样的求和。点积是 u1 v1 + u2 v2 + u3 v3。矩阵乘向量的分量是对 k 求和的 A(i,k) 乘 x(k)。进入四维与弯曲空间，这些求和号便层出不穷，把页面塞满。[[einstein-summation-convention|爱因斯坦求和约定]]是一条记账规则，让你几乎能抹去每一个 sigma。据说爱因斯坦曾打趣，说自己借此对数学作出了最大的贡献——而这玩笑只说对了一半，因为这条规则真的在做事。

规则恰恰是这样：只要某个指标在同一项中出现两次——一次在上、一次在下——就自动对它在其整个取值范围内求和，无需写出 sigma。于是 a^i b_i 暗中表示 a^1 b_1 + a^2 b_2 + ... + a^n b_n。像这样被求和掉的重复指标称为哑指标（或求和指标），它的名字根本无关紧要：a^i b_i 与 a^k b_k 表示的是同一个数，所以你可以自由地给哑指标改名以避免冲突。在一项中只出现一次的指标是自由指标；它标明你指的是哪个分量，且必须在每一项、方程两边都以相同的上下位置出现。

READING AN INDEXED EXPRESSION

  a^i b_i   ( n = 3 )   ->   a^1 b_1 + a^2 b_2 + a^3 b_3     ( one hidden sum )

  i is a DUMMY index : up once, down once, summed, name irrelevant
     a^i b_i  =  a^k b_k  =  a^m b_m            ( all the same number )

  In   c^i = A^i_j x^j :
     j  appears up-and-down  -> DUMMY  (summed: matrix times vector)
     i  appears once each side -> FREE   (labels the 3 components of c)

  ds^2 = g_{ij} dx^i dx^j   ->   TWO dummy pairs (i and j)
     a double sum: 9 terms in 3-D, written as 4 symbols

  INDEX-BALANCE CHECK (do this on every line):
     free indices on the LEFT must match free indices on the RIGHT,
     same names, same up/down slots.  If they don't, you slipped.

如何读重复（哑）指标与单个（自由）指标，以及那个一秒钟的指标平衡校验，它能抓住大多数代数失误。

两个粘合符号：delta 与 epsilon

两个特殊符号把上面的规则变成一套能用的代数。第一个是克罗内克 delta，delta^i_j，定义为 i = j 时取 1、否则取 0——它不过是带上指标的单位矩阵 [1, 0; 0, 1]。它的活儿是改名与缩并：在像 delta^i_j v^j 这样的求和里，delta 只有当 j 等于 i 时才非零，于是整个求和塌缩成 v^i。换言之，delta^i_j 像一个「替换算子」，专门追捕一个哑指标并把它替换掉。每当计算里冒出一个缠进求和的克罗内克 delta，你通常能当场化简，让它吞掉一个哑指标。

第二个是列维-奇维塔符号 epsilon_{ijk}，对 (1, 2, 3) 的偶置换取 +1，奇置换取 -1，任意两个指标相等时取 0。这个小小的反对称对象，正是编码叉积与行列式的那一个。你在本卷前面遇到的叉积 nabla cross F，写成分量便是 c^i = epsilon^{ijk} a_j b_k——留意指标平衡：i 是唯一的自由指标，标记输出的三个分量，而 j 与 k 各是被求和掉的哑指标对。3 乘 3 矩阵的行列式同样是单个 epsilon 缩并。于是这两个符号之间便囊括了恒等、互换、旋转与定向——线性代数的全部词汇，打包进 delta 与 epsilon。

缩并、自由指标，以及它换来什么

整套记法里最重要的一步动作是缩并：把一个上指标与一个同名的下指标配对并求和，如 v^i w_i。这不是闲置的简写——它恰是构造与坐标无关的量的那个操作。因为上指标按坐标变换的雅可比变换、下指标按逆雅可比变换，这两个变换因子互为逆元；把它们缩并，两个因子恰好相消，存活下来的是一个真正的几何标量，每个观察者、在每个标架中都一致认同。点积 v^i w_i 是最干净的例子：一个数，与标架无关，从单次缩并里诞生。

这也是这套记法作为张量语言而立功之处。一个真正的[[tensor-transformation-law|张量方程]]，是写成「张量 = 张量」、两边自由指标相同且处于相同上下位置的方程。变换律于是保证一件了不起的事：这样的方程若在一个坐标系成立，便同时在每个坐标系成立——单次推导一举确立一条在所有标架中都成立的自然律。这就是广义协变原理，也是相对论、连续介质力学与电磁学全都这样书写的缘由。但有一处界限要诚实：带有指标并不使一个对象成为张量。你很快会遇到的联络系数（克里斯托费尔符号）带有指标，却不满足变换律，这正是为什么张量的偏导数本身不是张量、协变导数不得不被发明出来。

把每个分量都写成带名字的指标，上指标配逆变槽（箭头，v^i），下指标配协变槽（梯度，w_i）。位置是信息，不是装饰。
找出哑指标对——每个一上一下出现一次的指标——并按爱因斯坦约定把它们读作隐藏的求和；给任何会冲突的哑指标改名。
做指标平衡校验：左右两边的自由指标必须在名字与上下位置上一致。不匹配，或任何指标出现三次，都意味着出错——继续之前先改正。
用 delta 来替换与化简，用 epsilon 来处理叉积与行列式，每当你想要一个所有坐标系都认同的量时，就把一个上指标与一个下指标缩并。