从最短路径到大自然选择的路径
在本梯级前面的几篇指南里,你学会了对整条曲线(而非一个数)做优化:一个泛函吃进一个函数 y(x),吐出一个数值——一条悬链的长度、一条最速降线上的下滑时间——而令一阶变分为零便得到欧拉-拉格朗日方程。那是几何。本篇最后一份指南里令人惊叹的转折在于:同一套机器也支配着物质如何运动。原来,物理本身就是一个伪装起来的变分问题。
回想你在第一卷里最早做过的优化:你通过令一个普通函数的导数为零来寻找它的临界点。变分法就是把这个想法提升到无穷多维——你扰动的不再是一个数 x,而是整条轨迹,并要求积分的主导变化为零。请记住这幅图景:是驻定,而未必是极小。我们会看到这一点很重要。
哈密顿原理与拉格朗日量
哈密顿最小作用量原理说:在一个系统于时刻 t1 和 t2 之间、起点与终点构型固定的所有可设想运动 q(t) 当中,大自然真正走的那一条让作用量 S 取驻值。作用量是某个称为拉格朗日量的单一函数 L 对时间的积分:S = 从 t1 到 t2 对 L(q, q-dot, t) dt 积分,其中 q-dot = dq/dt 是速度。对于普通力学,L = T - V,即动能减势能——乍看是个奇怪的组合,并不是总能量 T + V。
现在把这个作用量送进欧拉-拉格朗日机器,让 q 扮演 y 的角色、t 扮演 x 的角色。驻定条件 d/dt(partial L / partial q-dot) - partial L / partial q = 0 随即跳出——而对 L = T - V,它恰好就是牛顿第二定律 ma = F,其中 -partial V / partial q 即是力。所以 F = ma 并非一条独立的公理;它正是作用量的欧拉-拉格朗日方程。深层的回报是:这套方法在任意坐标下都成立——角度、沿导线的弧长、广义坐标——因为偏导数会自动处理记账工作。
Action: S[q] = integral_{t1}^{t2} L(q, q', t) dt, q' = dq/dt
Euler-Lagrange: d/dt ( dL/dq' ) - dL/dq = 0
Mechanics: L = T - V = (1/2) m q'^2 - V(q)
dL/dq' = m q' dL/dq = -dV/dq
d/dt(m q') = -dV/dq => m q'' = F (Newton)过渡到哈密顿:能量接管方向盘
还有第二幅互补的图景。定义动量 p = partial L / partial q-dot(对自由粒子,这就是我们熟悉的质量乘速度),然后通过勒让德变换把速度 q-dot 换成 p,构造出哈密顿量 H = p q-dot - L。对我们的力学例子,这奇迹般地得出 H = T + V,即总能量。整套框架就是拉格朗日力学与哈密顿力学,是同一枚硬币的两面。
那一条二阶的欧拉-拉格朗日方程如今分裂成两条优雅的一阶方程,即哈密顿方程:q-dot = partial H / partial p 与 p-dot = -partial H / partial q。在几何上,系统的状态是相空间中的一点 (q, p),而 H 生成它的流——当 H 不显含时间时,系统沿能量守恒的等值线滑行。这正是日后构建量子力学与统计力学所用的语言,也是数学家如此在意 ma = F 背后所藏结构的原因。
回到本梯级的一座熟悉桥梁:当拉格朗日量不显含 x(这里是不显含 t)时,贝尔特拉米恒等式早已告诉你,沿极值曲线有一个组合保持不变。在力学中,那个常量正是哈密顿量——能量守恒不过是戴上物理学家帽子的贝尔特拉米恒等式。你在好几篇指南里一直牵着的那根变分线索,在此直接系到了科学中最著名的守恒律上。
诺特:每一种对称都藏着一条守恒律
诺特定理是整个数学中最美的结果之一。它说:作用量的每一种连续对称都给出一个守恒量,反之亦然。若拉格朗日量在时间平移下不变,能量守恒;若它在把整个实验沿空间平移时不变,动量守恒;若它在旋转下不变,角动量守恒。对称与守恒并非两件事,而是同一件事从两面看。
其机制美妙地具体。设想沿某个小对称扰动坐标,q -> q + epsilon*(某物),到一阶让作用量保持不变。运行产生欧拉-拉格朗日方程的同一套变分,但这次往常被我们靠固定端点消掉的边界项,反而携带了信息。把“作用量不变”与“运动方程成立”结合起来,就迫使 q 与 p 的某个组合的时间导数为零。那个组合就是守恒荷。守恒律实实在在地从对称下一阶变分为零中读出。
最优控制初窥
经典变分问的是:当自然可自由游走时,最好的路径是什么。最优控制问的是一个更尖锐、更现代的问题:你可以用一个由你在每一时刻选定的控制输入 u(t) 来驾驭系统——但它是有界的(火箭推力不能超过最大值,刹车不能比轮胎所允许的拉得更狠)。在动力学约束下,找出使某项代价(比如耗油或耗时)最小的控制。这是变分法成长后与工程学和经济学相遇的样子。
为何这不只是又一个欧拉-拉格朗日问题?因为最优常常坐落在容许控制的边界上——推力先全开,再骤然全关——而在拐角处,光滑的“导数为零”条件失效。令一个导数为零只能找到内部最优;这里最优之举却是径直撞上约束。我们需要一件能应付那堵墙、而不只是光滑谷底的工具。
庞特里亚金极大值原理正是这件工具,而且它把哈密顿的图景漂亮地推广了开来。你由代价与动力学构造出一个控制哈密顿量,引入一个伴态(一个类动量的乘子,你或许会认出它是约束的泛函拉格朗日乘子),然后——不再是“求导并令其为零”——你要求最优控制在每一时刻于容许集上使该哈密顿量取极大。在拐角处它选边界,在内部则退化为我们熟悉的驻定条件。著名的砰-砰控制(推力先全开,再全无)就是直接从这条原理里掉出来的。
你可以带走什么
退一步,看看一个想法走了多远。你在本梯级开篇时还在问悬链是什么形状;收尾时你已握有一条原理,整个力学——乃至量子理论与现代工程的骨架——都能从它推导出来。那根线索始终未变:写下一个泛函,要求它的一阶变分为零,读出一条运动方程,再利用对称把它积出来。
不过,也要诚实面对这个故事的边界。最简形式的哈密顿原理假定力是源自某势的保守力;摩擦及其他耗散效应需要额外的项或修改后的作用量。诺特定理需要的是连续对称——镜面反射这类离散翻转并不能由此给出守恒量。而“驻定”从未承诺“极小”。准确知道一个强大方法在哪里止步,是善用它的一部分——这正是你当初学到“导数为零标记的是临界点、而未必是极小”时所练就的同一种纪律。