JOVANA
Library Glossary Getting Started Three Levels Fields How it works Mission
Join the mission
All guides

最小作用量:變分變成物理

大自然彷彿在做最佳化:粒子的真實路徑讓某個積分取駐值。從這一個想法出發,便生出拉格朗日力學與哈密頓力學、諾特定理對對稱性與守恆律的深刻關聯,以及現代最佳控制理論。

從最短路徑到大自然選擇的路徑

在本梯級前面的幾篇指南裡,你學會了對整條曲線(而非一個數)做最佳化:一個泛函吃進一個函數 y(x),吐出一個數值——一條懸鏈的長度、一條最速降線上的下滑時間——而令一階變分為零便得到歐拉-拉格朗日方程。那是幾何。本篇最後一份指南裡令人驚嘆的轉折在於:同一套機器也支配著物質如何運動。原來,物理本身就是一個偽裝起來的變分問題。

回想你在第一卷裡最早做過的最佳化:你通過令一個普通函數的導數為零來尋找它的臨界點。變分法就是把這個想法提升到無窮多維——你擾動的不再是一個數 x,而是整條軌跡,並要求積分的主導變化為零。請記住這幅圖景:是駐定,而未必是極小。我們會看到這一點很重要。

漢密頓原理與拉格朗日量

漢密頓最小作用量原理說:在一個系統於時刻 t1 和 t2 之間、起點與終點構型固定的所有可設想運動 q(t) 當中,大自然真正走的那一條讓作用量 S 取駐值。作用量是某個稱為拉格朗日量的單一函數 L 對時間的積分:S = 從 t1 到 t2 對 L(q, q-dot, t) dt 積分,其中 q-dot = dq/dt 是速度。對於普通力學,L = T - V,即動能減勢能——乍看是個奇怪的組合,並不是總能量 T + V。

現在把這個作用量送進歐拉-拉格朗日機器,讓 q 扮演 y 的角色、t 扮演 x 的角色。駐定條件 d/dt(partial L / partial q-dot) - partial L / partial q = 0 隨即跳出——而對 L = T - V,它恰好就是牛頓第二定律 ma = F,其中 -partial V / partial q 即是力。所以 F = ma 並非一條獨立的公理;它正是作用量的歐拉-拉格朗日方程。深層的回報是:這套方法在任意座標下都成立——角度、沿導線的弧長、廣義座標——因為偏導數會自動處理記帳工作。

Action:   S[q] = integral_{t1}^{t2}  L(q, q', t) dt,   q' = dq/dt

Euler-Lagrange:   d/dt ( dL/dq' ) - dL/dq = 0

Mechanics:  L = T - V = (1/2) m q'^2 - V(q)
   dL/dq' = m q'        dL/dq = -dV/dq
   d/dt(m q') = -dV/dq   =>   m q'' = F      (Newton)
作用量、它的歐拉-拉格朗日方程,以及 L = T - V 如何重現 ma = F。

過渡到漢密頓:能量接管方向盤

還有第二幅互補的圖景。定義動量 p = partial L / partial q-dot(對自由粒子,這就是我們熟悉的質量乘速度),然後通過勒讓德變換把速度 q-dot 換成 p,構造出漢密頓量 H = p q-dot - L。對我們的力學例子,這奇蹟般地得出 H = T + V,即總能量。整套框架就是拉格朗日力學與漢密頓力學,是同一枚硬幣的兩面。

那一條二階的歐拉-拉格朗日方程如今分裂成兩條優雅的一階方程,即漢密頓方程:q-dot = partial H / partial p 與 p-dot = -partial H / partial q。在幾何上,系統的狀態是相空間中的一點 (q, p),而 H 生成它的流——當 H 不顯含時間時,系統沿能量守恆的等值線滑行。這正是日後構建量子力學與統計力學所用的語言,也是數學家如此在意 ma = F 背後所藏結構的原因。

回到本梯級的一座熟悉橋樑:當拉格朗日量不顯含 x(這裡是不顯含 t)時,貝爾特拉米恆等式早已告訴你,沿極值曲線有一個組合保持不變。在力學中,那個常量正是漢密頓量——能量守恆不過是戴上物理學家帽子的貝爾特拉米恆等式。你在好幾篇指南裡一直牽著的那根變分線索,在此直接繫到了科學中最著名的守恆律上。

諾特:每一種對稱都藏著一條守恆律

諾特定理是整個數學中最美的結果之一。它說:作用量的每一種連續對稱都給出一個守恆量,反之亦然。若拉格朗日量在時間平移下不變,能量守恆;若它在把整個實驗沿空間平移時不變,動量守恆;若它在旋轉下不變,角動量守恆。對稱與守恆並非兩件事,而是同一件事從兩面看。

其機制美妙地具體。設想沿某個小對稱擾動座標,q -> q + epsilon*(某物),到一階讓作用量保持不變。運行產生歐拉-拉格朗日方程的同一套變分,但這次往常被我們靠固定端點消掉的邊界項,反而攜帶了資訊。把「作用量不變」與「運動方程成立」結合起來,就迫使 q 與 p 的某個組合的時間導數為零。那個組合就是守恆荷。守恆律實實在在地從對稱下一階變分為零中讀出。

最佳控制初窺

經典變分問的是:當自然可自由遊走時,最好的路徑是什麼。最佳控制問的是一個更尖銳、更現代的問題:你可以用一個由你在每一時刻選定的控制輸入 u(t) 來駕馭系統——但它是有界的(火箭推力不能超過最大值,剎車不能比輪胎所允許的拉得更狠)。在動力學約束下,找出使某項代價(比如耗油或耗時)最小的控制。這是變分法成長後與工程學和經濟學相遇的樣子。

為何這不只是又一個歐拉-拉格朗日問題?因為最優常常坐落在容許控制的邊界上——推力先全開,再驟然全關——而在拐角處,光滑的「導數為零」條件失效。令一個導數為零只能找到內部最優;這裡最優之舉卻是徑直撞上約束。我們需要一件能應付那堵牆、而不只是光滑谷底的工具。

龐特里亞金極大值原理正是這件工具,而且它把漢密頓的圖景漂亮地推廣了開來。你由代價與動力學構造出一個控制漢密頓量,引入一個伴態(一個類動量的乘子,你或許會認出它是約束的泛函拉格朗日乘子),然後——不再是「求導並令其為零」——你要求最優控制在每一時刻於容許集上使該漢密頓量取極大。在拐角處它選邊界,在內部則退化為我們熟悉的駐定條件。著名的砰-砰控制(推力先全開,再全無)就是直接從這條原理裡掉出來的。

你可以帶走什麼

退一步,看看一個想法走了多遠。你在本梯級開篇時還在問懸鏈是什麼形狀;收尾時你已握有一條原理,整個力學——乃至量子理論與現代工程的骨架——都能從它推導出來。那根線索始終未變:寫下一個泛函,要求它的一階變分為零,讀出一條運動方程,再利用對稱把它積出來。

不過,也要誠實面對這個故事的邊界。最簡形式的漢密頓原理假定力是源自某勢的保守力;摩擦及其他耗散效應需要額外的項或修改後的作用量。諾特定理需要的是連續對稱——鏡面反射這類離散翻轉並不能由此給出守恆量。而「駐定」從未承諾「極小」。準確知道一個強大方法在哪裡止步,是善用它的一部分——這正是你當初學到「導數為零標記的是臨界點、而未必是極小」時所練就的同一種紀律。