JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

最小作用量:变分变成物理

大自然仿佛在做优化:粒子的真实路径让某个积分取驻值。从这一个想法出发,便生出拉格朗日力学与哈密顿力学、诺特定理对对称性与守恒律的深刻关联,以及现代最优控制理论。

从最短路径到大自然选择的路径

在本梯级前面的几篇指南里,你学会了对整条曲线(而非一个数)做优化:一个泛函吃进一个函数 y(x),吐出一个数值——一条悬链的长度、一条最速降线上的下滑时间——而令一阶变分为零便得到欧拉-拉格朗日方程。那是几何。本篇最后一份指南里令人惊叹的转折在于:同一套机器也支配着物质如何运动。原来,物理本身就是一个伪装起来的变分问题。

回想你在第一卷里最早做过的优化:你通过令一个普通函数的导数为零来寻找它的临界点。变分法就是把这个想法提升到无穷多维——你扰动的不再是一个数 x,而是整条轨迹,并要求积分的主导变化为零。请记住这幅图景:是驻定,而未必是极小。我们会看到这一点很重要。

哈密顿原理与拉格朗日量

哈密顿最小作用量原理说:在一个系统于时刻 t1 和 t2 之间、起点与终点构型固定的所有可设想运动 q(t) 当中,大自然真正走的那一条让作用量 S 取驻值。作用量是某个称为拉格朗日量的单一函数 L 对时间的积分:S = 从 t1 到 t2 对 L(q, q-dot, t) dt 积分,其中 q-dot = dq/dt 是速度。对于普通力学,L = T - V,即动能减势能——乍看是个奇怪的组合,并不是总能量 T + V。

现在把这个作用量送进欧拉-拉格朗日机器,让 q 扮演 y 的角色、t 扮演 x 的角色。驻定条件 d/dt(partial L / partial q-dot) - partial L / partial q = 0 随即跳出——而对 L = T - V,它恰好就是牛顿第二定律 ma = F,其中 -partial V / partial q 即是力。所以 F = ma 并非一条独立的公理;它正是作用量的欧拉-拉格朗日方程。深层的回报是:这套方法在任意坐标下都成立——角度、沿导线的弧长、广义坐标——因为偏导数会自动处理记账工作。

Action:   S[q] = integral_{t1}^{t2}  L(q, q', t) dt,   q' = dq/dt

Euler-Lagrange:   d/dt ( dL/dq' ) - dL/dq = 0

Mechanics:  L = T - V = (1/2) m q'^2 - V(q)
   dL/dq' = m q'        dL/dq = -dV/dq
   d/dt(m q') = -dV/dq   =>   m q'' = F      (Newton)
作用量、它的欧拉-拉格朗日方程,以及 L = T - V 如何重现 ma = F。

过渡到哈密顿:能量接管方向盘

还有第二幅互补的图景。定义动量 p = partial L / partial q-dot(对自由粒子,这就是我们熟悉的质量乘速度),然后通过勒让德变换把速度 q-dot 换成 p,构造出哈密顿量 H = p q-dot - L。对我们的力学例子,这奇迹般地得出 H = T + V,即总能量。整套框架就是拉格朗日力学与哈密顿力学,是同一枚硬币的两面。

那一条二阶的欧拉-拉格朗日方程如今分裂成两条优雅的一阶方程,即哈密顿方程:q-dot = partial H / partial p 与 p-dot = -partial H / partial q。在几何上,系统的状态是相空间中的一点 (q, p),而 H 生成它的流——当 H 不显含时间时,系统沿能量守恒的等值线滑行。这正是日后构建量子力学与统计力学所用的语言,也是数学家如此在意 ma = F 背后所藏结构的原因。

回到本梯级的一座熟悉桥梁:当拉格朗日量不显含 x(这里是不显含 t)时,贝尔特拉米恒等式早已告诉你,沿极值曲线有一个组合保持不变。在力学中,那个常量正是哈密顿量——能量守恒不过是戴上物理学家帽子的贝尔特拉米恒等式。你在好几篇指南里一直牵着的那根变分线索,在此直接系到了科学中最著名的守恒律上。

诺特:每一种对称都藏着一条守恒律

诺特定理是整个数学中最美的结果之一。它说:作用量的每一种连续对称都给出一个守恒量,反之亦然。若拉格朗日量在时间平移下不变,能量守恒;若它在把整个实验沿空间平移时不变,动量守恒;若它在旋转下不变,角动量守恒。对称与守恒并非两件事,而是同一件事从两面看。

其机制美妙地具体。设想沿某个小对称扰动坐标,q -> q + epsilon*(某物),到一阶让作用量保持不变。运行产生欧拉-拉格朗日方程的同一套变分,但这次往常被我们靠固定端点消掉的边界项,反而携带了信息。把“作用量不变”与“运动方程成立”结合起来,就迫使 q 与 p 的某个组合的时间导数为零。那个组合就是守恒荷。守恒律实实在在地从对称下一阶变分为零中读出。

最优控制初窥

经典变分问的是:当自然可自由游走时,最好的路径是什么。最优控制问的是一个更尖锐、更现代的问题:你可以用一个由你在每一时刻选定的控制输入 u(t) 来驾驭系统——但它是有界的(火箭推力不能超过最大值,刹车不能比轮胎所允许的拉得更狠)。在动力学约束下,找出使某项代价(比如耗油或耗时)最小的控制。这是变分法成长后与工程学和经济学相遇的样子。

为何这不只是又一个欧拉-拉格朗日问题?因为最优常常坐落在容许控制的边界上——推力先全开,再骤然全关——而在拐角处,光滑的“导数为零”条件失效。令一个导数为零只能找到内部最优;这里最优之举却是径直撞上约束。我们需要一件能应付那堵墙、而不只是光滑谷底的工具。

庞特里亚金极大值原理正是这件工具,而且它把哈密顿的图景漂亮地推广了开来。你由代价与动力学构造出一个控制哈密顿量,引入一个伴态(一个类动量的乘子,你或许会认出它是约束的泛函拉格朗日乘子),然后——不再是“求导并令其为零”——你要求最优控制在每一时刻于容许集上使该哈密顿量取极大。在拐角处它选边界,在内部则退化为我们熟悉的驻定条件。著名的砰-砰控制(推力先全开,再全无)就是直接从这条原理里掉出来的。

你可以带走什么

退一步,看看一个想法走了多远。你在本梯级开篇时还在问悬链是什么形状;收尾时你已握有一条原理,整个力学——乃至量子理论与现代工程的骨架——都能从它推导出来。那根线索始终未变:写下一个泛函,要求它的一阶变分为零,读出一条运动方程,再利用对称把它积出来。

不过,也要诚实面对这个故事的边界。最简形式的哈密顿原理假定力是源自某势的保守力;摩擦及其他耗散效应需要额外的项或修改后的作用量。诺特定理需要的是连续对称——镜面反射这类离散翻转并不能由此给出守恒量。而“驻定”从未承诺“极小”。准确知道一个强大方法在哪里止步,是善用它的一部分——这正是你当初学到“导数为零标记的是临界点、而未必是极小”时所练就的同一种纪律。