1. 广义坐标 (Generalized Coordinates)
考虑一个 1 个自由度的系统,比如单摆。在传统的笛卡尔坐标系下,我们往往要多引入一个约束方程(x2+y2=l2)来解决这个问题。但如果是极坐标系,却只需要一个变量 θ 就能描述,且运动方程极其简洁:
θ¨+lgθ=0
这似乎暗示着有一种更加合适、解耦的方式来描述这个系统。
在此,我们定义 s 个自由度的系统的广义坐标 q1,q2,…,qs 为可以完全刻画其位置的 s 个变量,其导数 q˙ 就是广义速度。
经验告诉我们,在牛顿力学体系下,只需要知道了 q 和 q˙ 就可以确定整个系统未来的状态。这意味着,牛顿力学下,我们的世界是一个二阶微分系统,自然地我们会想到存在这样一个映射:
f(q,q˙)→q¨
不过这个映射究竟是什么呢?引入最小作用原理之前,我们不妨想像一下:在确定了系统首尾状态的情况下,明明有无数条路径可以走,但现实却只选择了其中一条。
想必一定有其特殊之处… 比如… 让某个函数取极值?
2. 最小作用量原理
我们进行如下定义:每一个力学系统都可以通过一个确定的函数——拉格朗日量 (Lagrangian) 来表征:
L(q,q˙,t)
此时不妨设作用量 (Action) S 为该函数的时间积分:
S=∫t1t2L(q,q˙,t)dt
关于这个泛函,我们的 q 和 q˙ 会让它取最小值 严格来说,最小作用量原理的表述并不是对系统的整个运动轨迹总成立,而是仅在足够小的区段上成立。对于整个轨迹来说,积分 S 只能取极值(驻点)而不一定是最小值。当然,这对于推导运动方程没有影响,因为我们只需用到极值条件 δS=0。 严格来说,最小作用量原理的表述并不是对系统的整个运动轨迹总成立,而是仅在足够小的区段上成立。对于整个轨迹来说,积分 S 只能取极值(驻点)而不一定是最小值。当然,这对于推导运动方程没有影响,因为我们只需用到极值条件 δS=0。 。下面我们来进行求解。
我们要寻找函数 q(t),使得作用量 S 取极值。根据变分原理,我们需要 δS=0。
假设真实路径为 q(t),我们给它施加一个微小的扰动 δq(t)。为了保证路径的起点和终点不变,我们要求在端点处的扰动为零:
δq(t1)=δq(t2)=0
作用量的变分 δS 可以写为拉格朗日量 L 的变分的时间积分:
δS=∫t1t2δL(q,q˙,t)dt
利用全微分展开(链式法则),我们将 δL 展开为:
δS=∫t1t2(∂q∂Lδq+∂q˙∂Lδq˙)dt
关键步骤:处理第二项
我们需要将 δq˙ 转化为与 δq 相关的形式。这里利用了微分与变分的可交换性:
(注:为什么 δq˙=dtd(δq)?)
变分 δ 是对函数形式(路径形状)的微扰,而微分 d/dt 是对时间的运算。由于路径的变化 δq 和时间 t 是相互独立的变量,因此运算顺序可以交换。数学上:
δq˙=δ(dtdq)=dtd(q+δq)−dtdq=dtd(δq)
于是,积分变为:
δS=∫t1t2(∂q∂Lδq+∂q˙∂Ldtd(δq))dt
对第二项进行分部积分 (Integration by Parts):
令 u=∂q˙∂L,dv=dtd(δq)dt=d(δq),则:
∫t1t2∂q˙∂Ldtd(δq)dt=[∂q˙∂Lδq]t1t2−∫t1t2δqdtd(∂q˙∂L)dt
由于端点固定条件 δq(t1)=δq(t2)=0,第一项(边界项)消失。将剩余部分代回原式:
δS=∫t1t2(∂q∂L−dtd∂q˙∂L)δqdt=0
变分法基本引理
根据变分法基本引理:如果对于任意满足边界条件的 δq(t),上述积分恒为零,则被积函数必须恒为零。
因此,我们得到了力学的运动方程——欧拉-拉格朗日方程:
dtd(∂q˙∂L)−∂q∂L=0
物理直觉与规范变换
值得一提的是,上述推导完全是一个与物理无关的数学过程。真正往这个壳子里面赋予内容的是我们的物理直觉。
在这里我们先看看方程对拉格朗日量的“宽容程度”。注意到我们随意往 L 乘一个常数 c 并不会导致运动方程的变化。不过出于可加性(对一个系统下两个不相干的部分 A,B,有 L=LA+LB),我们必须得对每个部分乘相同的常数。这一定程度体现了对于单位选择的自由性。
如果你注意力集中,同样不难发现加一个函数 f(q,t) 对时间 t 的全导数也不会影响结果:
L′=L+dtdf(q,t)
这将导出我们下面的伽利略变换不变性。
3. 伽利略相对性原理
经典视角下,参考系是我们研究物理的必要手段。然而众所周知,不同参考系下的运动规律总是不一样的,就好比牛顿定律放在非惯性系下就不成立。
- 有的系下空间是不均匀的;
- 有的系是各向异性的;
- 有的连不同时刻都不等价。
但是在这样的情况下,似乎总是存在一个空间均匀、各向同性、时间均匀的参考系,我们称之为惯性参考系。现在我们考虑导出自由粒子在惯性系下的拉格朗日量。
3.1 形式的确定
对位移矢量 r 施加一个偏移,可知物理规律不变(空间均匀性),所以 L 不应该依赖于 r。时间同理(时间均匀性)。
那么速度的方向呢?由于空间各向同性,方向似乎也不重要。于是我们便大概得出了一个形式:拉格朗日量只能是速度大小平方的函数。
L=L(v2)
写出它的拉格朗日方程:
dtd∂v∂L−∂r∂L=0⇒dtd∂v∂L=0
由此可得 ∂L/∂v=const.
利用链式法则:
∂v∂L=d(v2)dL⋅∂v∂(v2)=2L′(v2)⋅v
由于动量 ∂L/∂v 是常矢量,且上述映射是一个单射 这里隐含了一个数学条件:映射 v→p 必须是可逆的(单射)。在物理上,这意味着动量守恒等价于速度守恒。 这里隐含了一个数学条件:映射 v→p 必须是可逆的(单射)。在物理上,这意味着动量守恒等价于速度守恒。 ,故:
v=const.
于是我们就得到了惯性系下的自由粒子速度不变(牛顿第一定律)。
3.2 导出 L=21mv2
现在引入另一个惯性系 K′ 相对于另一个系 K 以微小速度 ϵ 运动:v′=v+ϵ。
由于惯性系的等价性,改变后的 L′ 应该只改变了一个关于时间和坐标的全导数。代入展开后有:
L(v′2)=L((v+ϵ)2)≈L(v2)+2∂(v2)∂L(v⋅ϵ)
第二项即为 L′−L。若想使得这一项成为关于坐标和时间的全导数 dtdf(r,t),注意到 v=dtdr,则系数 2∂(v2)∂L 必须与 v 无关(即为常数)。
由此可以导出 L(v2) 必须与 v2 成正比:
L=21mv2
容易看出 m 必须非负,否则作用量没有最小值。
附:坐标系与度规几何
既然拉格朗日量 L=21mv2,确定的 L 的形式本质上就是确定速度平方 v2 在不同坐标系下的表达。
从几何角度看,速度是位置矢量 r 对时间的导数,而 v2 本质上是空间线元dl 对时间的缩放:
v2=(dtdl)2=dt2dl2
这意味着,我们只需要知道当前坐标系下的弧长公式 dl2,就能直接写出拉格朗日量。
1. 欧几里得空间的度规结构
我们讨论的背景是三维欧几里得空间(平坦空间)。这里的“平坦”意味着空间曲率为零,但并不意味着所有坐标系下的度规张量 gij 都是单位矩阵 在广义相对论中,引力由时空弯曲引起,而在经典力学中,只要我们还在惯性系,空间本身就是平坦的 (Flat)。曲线坐标系引入的只是“虚假的”几何项(克里斯托费尔符号),而非真实的曲率。 在广义相对论中,引力由时空弯曲引起,而在经典力学中,只要我们还在惯性系,空间本身就是平坦的 (Flat)。曲线坐标系引入的只是“虚假的”几何项(克里斯托费尔符号),而非真实的曲率。 。
线元的一般形式由度规张量定义:
dl2=i,j∑gijdqidqj
2. 常见坐标系下的 L
A. 笛卡尔坐标系
这是最简单的形式,度规为单位矩阵 gij=δij。
dl2=dx2+dy2+dz2
L=2m(x˙2+y˙2+z˙2)
B. 柱坐标系
坐标变换为 (r,ϕ,z)。注意这里 r 是距离 z 轴的距离。
dl2=dr2+r2dϕ2+dz2
这里出现了一个非对角项系数 r2,对应的拉格朗日量为:
L=2m(r˙2+r2ϕ˙2+z˙2)
C. 球坐标系
坐标变换为 (r,θ,ϕ)。这是处理中心力场(如行星运动、氢原子)最常用的坐标系。
dl2=dr2+r2dθ2+r2sin2θdϕ2
对应的拉格朗日量:
L=2m(r˙2+r2θ˙2+r2sin2θϕ˙2)
思考:
观察上述公式,虽然 L 的形式变复杂了,但物理本质(动能)没变。这些 r2 和 sin2θ 因子,正是雅可比矩阵在度规张量中的体现。
在后续章节推导 E-L 方程时,正是这些因子产生了离心力和科里奥利力等“惯性力”项。