最小作用量：变分变成物理

从最短路径到大自然选择的路径

在本梯级前面的几篇指南里，你学会了对整条曲线（而非一个数）做优化：一个泛函吃进一个函数 y(x)，吐出一个数值——一条悬链的长度、一条最速降线上的下滑时间——而令一阶变分为零便得到欧拉-拉格朗日方程。那是几何。本篇最后一份指南里令人惊叹的转折在于：同一套机器也支配着物质如何运动。原来，物理本身就是一个伪装起来的变分问题。

回想你在第一卷里最早做过的优化：你通过令一个普通函数的导数为零来寻找它的临界点。变分法就是把这个想法提升到无穷多维——你扰动的不再是一个数 x，而是整条轨迹，并要求积分的主导变化为零。请记住这幅图景：是驻定，而未必是极小。我们会看到这一点很重要。

哈密顿原理与拉格朗日量

哈密顿最小作用量原理说：在一个系统于时刻 t1 和 t2 之间、起点与终点构型固定的所有可设想运动 q(t) 当中，大自然真正走的那一条让作用量 S 取驻值。作用量是某个称为拉格朗日量的单一函数 L 对时间的积分：S = 从 t1 到 t2 对 L(q, q-dot, t) dt 积分，其中 q-dot = dq/dt 是速度。对于普通力学，L = T - V，即动能减势能——乍看是个奇怪的组合，并不是总能量 T + V。

现在把这个作用量送进欧拉-拉格朗日机器，让 q 扮演 y 的角色、t 扮演 x 的角色。驻定条件 d/dt(partial L / partial q-dot) - partial L / partial q = 0 随即跳出——而对 L = T - V，它恰好就是牛顿第二定律 ma = F，其中 -partial V / partial q 即是力。所以 F = ma 并非一条独立的公理；它正是作用量的欧拉-拉格朗日方程。深层的回报是：这套方法在任意坐标下都成立——角度、沿导线的弧长、广义坐标——因为偏导数会自动处理记账工作。

Action:   S[q] = integral_{t1}^{t2}  L(q, q', t) dt,   q' = dq/dt

Euler-Lagrange:   d/dt ( dL/dq' ) - dL/dq = 0

Mechanics:  L = T - V = (1/2) m q'^2 - V(q)
   dL/dq' = m q'        dL/dq = -dV/dq
   d/dt(m q') = -dV/dq   =>   m q'' = F      (Newton)

作用量、它的欧拉-拉格朗日方程，以及 L = T - V 如何重现 ma = F。

过渡到哈密顿：能量接管方向盘

还有第二幅互补的图景。定义动量 p = partial L / partial q-dot（对自由粒子，这就是我们熟悉的质量乘速度），然后通过勒让德变换把速度 q-dot 换成 p，构造出哈密顿量 H = p q-dot - L。对我们的力学例子，这奇迹般地得出 H = T + V，即总能量。整套框架就是拉格朗日力学与哈密顿力学，是同一枚硬币的两面。

那一条二阶的欧拉-拉格朗日方程如今分裂成两条优雅的一阶方程，即哈密顿方程：q-dot = partial H / partial p 与 p-dot = -partial H / partial q。在几何上，系统的状态是相空间中的一点 (q, p)，而 H 生成它的流——当 H 不显含时间时，系统沿能量守恒的等值线滑行。这正是日后构建量子力学与统计力学所用的语言，也是数学家如此在意 ma = F 背后所藏结构的原因。

回到本梯级的一座熟悉桥梁：当拉格朗日量不显含 x（这里是不显含 t）时，贝尔特拉米恒等式早已告诉你，沿极值曲线有一个组合保持不变。在力学中，那个常量正是哈密顿量——能量守恒不过是戴上物理学家帽子的贝尔特拉米恒等式。你在好几篇指南里一直牵着的那根变分线索，在此直接系到了科学中最著名的守恒律上。

诺特：每一种对称都藏着一条守恒律

诺特定理是整个数学中最美的结果之一。它说：作用量的每一种连续对称都给出一个守恒量，反之亦然。若拉格朗日量在时间平移下不变，能量守恒；若它在把整个实验沿空间平移时不变，动量守恒；若它在旋转下不变，角动量守恒。对称与守恒并非两件事，而是同一件事从两面看。

其机制美妙地具体。设想沿某个小对称扰动坐标，q -> q + epsilon*(某物)，到一阶让作用量保持不变。运行产生欧拉-拉格朗日方程的同一套变分，但这次往常被我们靠固定端点消掉的边界项，反而携带了信息。把“作用量不变”与“运动方程成立”结合起来，就迫使 q 与 p 的某个组合的时间导数为零。那个组合就是守恒荷。守恒律实实在在地从对称下一阶变分为零中读出。

最优控制初窥

经典变分问的是：当自然可自由游走时，最好的路径是什么。最优控制问的是一个更尖锐、更现代的问题：你可以用一个由你在每一时刻选定的控制输入 u(t) 来驾驭系统——但它是有界的（火箭推力不能超过最大值，刹车不能比轮胎所允许的拉得更狠）。在动力学约束下，找出使某项代价（比如耗油或耗时）最小的控制。这是变分法成长后与工程学和经济学相遇的样子。

为何这不只是又一个欧拉-拉格朗日问题？因为最优常常坐落在容许控制的边界上——推力先全开，再骤然全关——而在拐角处，光滑的“导数为零”条件失效。令一个导数为零只能找到内部最优；这里最优之举却是径直撞上约束。我们需要一件能应付那堵墙、而不只是光滑谷底的工具。

庞特里亚金极大值原理正是这件工具，而且它把哈密顿的图景漂亮地推广了开来。你由代价与动力学构造出一个控制哈密顿量，引入一个伴态（一个类动量的乘子，你或许会认出它是约束的泛函拉格朗日乘子），然后——不再是“求导并令其为零”——你要求最优控制在每一时刻于容许集上使该哈密顿量取极大。在拐角处它选边界，在内部则退化为我们熟悉的驻定条件。著名的砰-砰控制（推力先全开，再全无）就是直接从这条原理里掉出来的。

你可以带走什么

退一步，看看一个想法走了多远。你在本梯级开篇时还在问悬链是什么形状；收尾时你已握有一条原理，整个力学——乃至量子理论与现代工程的骨架——都能从它推导出来。那根线索始终未变：写下一个泛函，要求它的一阶变分为零，读出一条运动方程，再利用对称把它积出来。

不过，也要诚实面对这个故事的边界。最简形式的哈密顿原理假定力是源自某势的保守力；摩擦及其他耗散效应需要额外的项或修改后的作用量。诺特定理需要的是连续对称——镜面反射这类离散翻转并不能由此给出守恒量。而“驻定”从未承诺“极小”。准确知道一个强大方法在哪里止步，是善用它的一部分——这正是你当初学到“导数为零标记的是临界点、而未必是极小”时所练就的同一种纪律。