最小作用量：變分變成物理

從最短路徑到大自然選擇的路徑

在本梯級前面的幾篇指南裡，你學會了對整條曲線（而非一個數）做最佳化：一個泛函吃進一個函數 y(x)，吐出一個數值——一條懸鏈的長度、一條最速降線上的下滑時間——而令一階變分為零便得到歐拉-拉格朗日方程。那是幾何。本篇最後一份指南裡令人驚嘆的轉折在於：同一套機器也支配著物質如何運動。原來，物理本身就是一個偽裝起來的變分問題。

回想你在第一卷裡最早做過的最佳化：你通過令一個普通函數的導數為零來尋找它的臨界點。變分法就是把這個想法提升到無窮多維——你擾動的不再是一個數 x，而是整條軌跡，並要求積分的主導變化為零。請記住這幅圖景：是駐定，而未必是極小。我們會看到這一點很重要。

漢密頓原理與拉格朗日量

漢密頓最小作用量原理說：在一個系統於時刻 t1 和 t2 之間、起點與終點構型固定的所有可設想運動 q(t) 當中，大自然真正走的那一條讓作用量 S 取駐值。作用量是某個稱為拉格朗日量的單一函數 L 對時間的積分：S = 從 t1 到 t2 對 L(q, q-dot, t) dt 積分，其中 q-dot = dq/dt 是速度。對於普通力學，L = T - V，即動能減勢能——乍看是個奇怪的組合，並不是總能量 T + V。

現在把這個作用量送進歐拉-拉格朗日機器，讓 q 扮演 y 的角色、t 扮演 x 的角色。駐定條件 d/dt(partial L / partial q-dot) - partial L / partial q = 0 隨即跳出——而對 L = T - V，它恰好就是牛頓第二定律 ma = F，其中 -partial V / partial q 即是力。所以 F = ma 並非一條獨立的公理；它正是作用量的歐拉-拉格朗日方程。深層的回報是：這套方法在任意座標下都成立——角度、沿導線的弧長、廣義座標——因為偏導數會自動處理記帳工作。

Action:   S[q] = integral_{t1}^{t2}  L(q, q', t) dt,   q' = dq/dt

Euler-Lagrange:   d/dt ( dL/dq' ) - dL/dq = 0

Mechanics:  L = T - V = (1/2) m q'^2 - V(q)
   dL/dq' = m q'        dL/dq = -dV/dq
   d/dt(m q') = -dV/dq   =>   m q'' = F      (Newton)

作用量、它的歐拉-拉格朗日方程，以及 L = T - V 如何重現 ma = F。

過渡到漢密頓：能量接管方向盤

還有第二幅互補的圖景。定義動量 p = partial L / partial q-dot（對自由粒子，這就是我們熟悉的質量乘速度），然後通過勒讓德變換把速度 q-dot 換成 p，構造出漢密頓量 H = p q-dot - L。對我們的力學例子，這奇蹟般地得出 H = T + V，即總能量。整套框架就是拉格朗日力學與漢密頓力學，是同一枚硬幣的兩面。

那一條二階的歐拉-拉格朗日方程如今分裂成兩條優雅的一階方程，即漢密頓方程：q-dot = partial H / partial p 與 p-dot = -partial H / partial q。在幾何上，系統的狀態是相空間中的一點 (q, p)，而 H 生成它的流——當 H 不顯含時間時，系統沿能量守恆的等值線滑行。這正是日後構建量子力學與統計力學所用的語言，也是數學家如此在意 ma = F 背後所藏結構的原因。

回到本梯級的一座熟悉橋樑：當拉格朗日量不顯含 x（這裡是不顯含 t）時，貝爾特拉米恆等式早已告訴你，沿極值曲線有一個組合保持不變。在力學中，那個常量正是漢密頓量——能量守恆不過是戴上物理學家帽子的貝爾特拉米恆等式。你在好幾篇指南裡一直牽著的那根變分線索，在此直接繫到了科學中最著名的守恆律上。

諾特：每一種對稱都藏著一條守恆律

諾特定理是整個數學中最美的結果之一。它說：作用量的每一種連續對稱都給出一個守恆量，反之亦然。若拉格朗日量在時間平移下不變，能量守恆；若它在把整個實驗沿空間平移時不變，動量守恆；若它在旋轉下不變，角動量守恆。對稱與守恆並非兩件事，而是同一件事從兩面看。

其機制美妙地具體。設想沿某個小對稱擾動座標，q -> q + epsilon*(某物)，到一階讓作用量保持不變。運行產生歐拉-拉格朗日方程的同一套變分，但這次往常被我們靠固定端點消掉的邊界項，反而攜帶了資訊。把「作用量不變」與「運動方程成立」結合起來，就迫使 q 與 p 的某個組合的時間導數為零。那個組合就是守恆荷。守恆律實實在在地從對稱下一階變分為零中讀出。

最佳控制初窺

經典變分問的是：當自然可自由遊走時，最好的路徑是什麼。最佳控制問的是一個更尖銳、更現代的問題：你可以用一個由你在每一時刻選定的控制輸入 u(t) 來駕馭系統——但它是有界的（火箭推力不能超過最大值，剎車不能比輪胎所允許的拉得更狠）。在動力學約束下，找出使某項代價（比如耗油或耗時）最小的控制。這是變分法成長後與工程學和經濟學相遇的樣子。

為何這不只是又一個歐拉-拉格朗日問題？因為最優常常坐落在容許控制的邊界上——推力先全開，再驟然全關——而在拐角處，光滑的「導數為零」條件失效。令一個導數為零只能找到內部最優；這裡最優之舉卻是徑直撞上約束。我們需要一件能應付那堵牆、而不只是光滑谷底的工具。

龐特里亞金極大值原理正是這件工具，而且它把漢密頓的圖景漂亮地推廣了開來。你由代價與動力學構造出一個控制漢密頓量，引入一個伴態（一個類動量的乘子，你或許會認出它是約束的泛函拉格朗日乘子），然後——不再是「求導並令其為零」——你要求最優控制在每一時刻於容許集上使該漢密頓量取極大。在拐角處它選邊界，在內部則退化為我們熟悉的駐定條件。著名的砰-砰控制（推力先全開，再全無）就是直接從這條原理裡掉出來的。

你可以帶走什麼

退一步，看看一個想法走了多遠。你在本梯級開篇時還在問懸鏈是什麼形狀；收尾時你已握有一條原理，整個力學——乃至量子理論與現代工程的骨架——都能從它推導出來。那根線索始終未變：寫下一個泛函，要求它的一階變分為零，讀出一條運動方程，再利用對稱把它積出來。

不過，也要誠實面對這個故事的邊界。最簡形式的漢密頓原理假定力是源自某勢的保守力；摩擦及其他耗散效應需要額外的項或修改後的作用量。諾特定理需要的是連續對稱——鏡面反射這類離散翻轉並不能由此給出守恆量。而「駐定」從未承諾「極小」。準確知道一個強大方法在哪裡止步，是善用它的一部分——這正是你當初學到「導數為零標記的是臨界點、而未必是極小」時所練就的同一種紀律。