分析力学 Note 3: 再论最小作用量与相对论时空 | Feixiang Tao
Secret Blueprint
MC05 2026-01-12 15 MIN READ

分析力学 Note 3: 再论最小作用量与相对论时空

#Physics #Relativity #Action #Geometry

1. 寻找不变量

在经典力学中,L=TVL = T-V 似乎是天经地义的。但在相对论视角的分析力学中,我们必须重新审视作用量 SS 的定义。 物理定律在洛伦兹变换下应当保持形式不变,而作用量始终取极值,这意味着作用量 SS 必须是一个标量,即在所有惯性系下取值相同。

在闵可夫斯基时空中,最自然的几何不变量就是世界线的长度dsds)。 对于有质量粒子,其世界线是类时的,因此我们定义作用量与路径长度成正比。

为了量纲匹配(作用量量纲 [Energy][Time][Energy] \cdot [Time])并回退到经典极限,我们引入系数 mc-mcS=mcdsS = -mc \int ds

Why negative? 在欧几里得几何中,两点之间直线最短;但在闵氏时空,对于类时路径,直线(惯性运动)的固有时最长。为了符合最小作用量原理,我们需要加负号求极大值。


2. 固有时 τ\tau and 实验室时间 tt

与牛顿力学不同,相对论中没有绝对时间。我们面临两个选择来参数化这条世界线:

  1. **固有时 τ\tau **:粒子随身携带的时钟。
  2. 实验室时间 tt:观测者的时间,取决于参考系。

2.1 方案 A:以固有时 τ\tau 为参数(协变形式)

1. 几何背景与定义

  • 度规符号:采用常用的 ημν=diag(1,1,1,1)\eta_{\mu\nu} = \text{diag}(-1, 1, 1, 1)

  • 线元:时空间隔的平方定义为:

    ds2=ημνdxμdxν=c2dt2dx2ds^2 = -\eta_{\mu\nu} dx^\mu dx^\nu = c^2 dt^2 - d\mathbf{x}^2

    对于有质量粒子的真实运动(类时世界线),ds2>0ds^2 > 0

  • 固有时 (Proper Time):定义 dτ=ds/cd\tau = ds / c。它是粒子系本身感受到的时间流逝。

  • 4-速度 (4-Velocity):定义为坐标对固有时的导数:

    uμ=dxμdτu^\mu = \frac{dx^\mu}{d\tau}

2. 作用量与拉格朗日量

我们从最小作用量原理出发,假设作用量 SS 正比于世界线的长度:

S=mcdsS = -mc \int ds

利用 ds=ημνdxμdxνds = \sqrt{-\eta_{\mu\nu} dx^\mu dx^\nu},我们将积分变量变换为固有时 τ\tau。注意到 dxμ=uμdτdx^\mu = u^\mu d\tau,则:

ds=ημν(uμdτ)(uνdτ)=uμuμdτds = \sqrt{-\eta_{\mu\nu} (u^\mu d\tau) (u^\nu d\tau)} = \sqrt{-u^\mu u_\mu} \, d\tau

于是作用量写为:

S=(mcuμuμ)dτS = \int \left( -mc \sqrt{-u^\mu u_\mu} \right) d\tau

由此,我们直接读出了相对论协变形式的拉格朗日量:

L(xμ,uμ)=mcuρuρ\mathcal{L}(x^\mu, u^\mu) = -mc \sqrt{-u^\rho u_\rho}

2.1 广义动量

根据定义,共轭动量是拉格朗日量对广义速度(这里是 uμu^\mu)的偏导数:

pμ=Luμp_\mu = \frac{\partial \mathcal{L}}{\partial u^\mu}

我们需要计算 uμ(mcuρuρ)\frac{\partial}{\partial u^\mu} (-mc \sqrt{-u^\rho u_\rho})。 令 K=uρuρ=ηαβuαuβK = -u^\rho u_\rho = -\eta_{\alpha\beta} u^\alpha u^\beta。则 L=mcK\mathcal{L} = -mc \sqrt{K}

有:

Luμ=mcd(K)dKKuμ\frac{\partial \mathcal{L}}{\partial u^\mu} = -mc \cdot \frac{d(\sqrt{K})}{dK} \cdot \frac{\partial K}{\partial u^\mu}

第一部分

d(K)dK=12K=12u2\frac{d(\sqrt{K})}{dK} = \frac{1}{2\sqrt{K}} = \frac{1}{2\sqrt{-u^2}}

第二部分

Kuμ=uμ(ηαβuαuβ)=ηαβ(uαuμuβ+uαuβuμ)\begin{aligned} \frac{\partial K}{\partial u^\mu} &= \frac{\partial}{\partial u^\mu} (-\eta_{\alpha\beta} u^\alpha u^\beta) \\ &= -\eta_{\alpha\beta} \left( \frac{\partial u^\alpha}{\partial u^\mu} u^\beta + u^\alpha \frac{\partial u^\beta}{\partial u^\mu} \right) \end{aligned}

然后 uαuμ=δμα\frac{\partial u^\alpha}{\partial u^\mu} = \delta^\alpha_\mu

=ηαβ(δμαuβ+uαδμβ)=(ημβuβ+ηαμuα)=(uμ+uμ)=2uμ\begin{aligned} &= -\eta_{\alpha\beta} (\delta^\alpha_\mu u^\beta + u^\alpha \delta^\beta_\mu) \\ &= -(\eta_{\mu\beta} u^\beta + \eta_{\alpha\mu} u^\alpha) \\ &= -(u_\mu + u_\mu) \\ &= -2u_\mu \end{aligned}

合并: 将两部分乘起来:

pμ=mc12u2(2uμ)=mcu2uμp_\mu = -mc \cdot \frac{1}{2\sqrt{-u^2}} \cdot (-2u_\mu) = \frac{mc}{\sqrt{-u^2}} u_\mu

代入条件: 虽然在变分过程中 uμu^\mu 是独立变量,但在物理运动实现后,必须满足约束 u2=c\sqrt{-u^2} = c。代入消去 cc

pμ=mccuμ=muμp_\mu = \frac{mc}{c} u_\mu = m u_\mu

这就是我们熟悉的 4-动量定义。

2.2 E-L方程求解

给出E-L方程:

ddτ(Luμ)Lxμ=0\frac{d}{d\tau} \left( \frac{\partial \mathcal{L}}{\partial u^\mu} \right) - \frac{\partial \mathcal{L}}{\partial x^\mu} = 0
  1. 动量项:我们已经算出 Luμ=pμ=muμ\frac{\partial \mathcal{L}}{\partial u^\mu} = p_\mu = m u_\mu
  2. 力项:观察 L=mcu2\mathcal{L} = -mc \sqrt{-u^2},它不显含坐标 xμx^\mu(因为我们假设时空是平坦的,ημν\eta_{\mu\nu} 是常数)。因此: Lxμ=0\frac{\partial \mathcal{L}}{\partial x^\mu} = 0

于是方程简化为:

ddτ(muμ)=0dpμdτ=0\frac{d}{d\tau} (m u_\mu) = 0 \quad \Rightarrow \quad \frac{d p_\mu}{d\tau} = 0

2.2 方案 B:以实验室时间 tt 为参数(3+1 形式)

虽然固有时 τ\tau 在理论上很优美,但在实际实验中,我们测量的是实验室坐标时 tt空间位移 dxd\mathbf{x}。为了将理论与观测联系起来,我们需要将作用量 SS 用实验室变量表示。

1. 拉格朗日量的推导

我们的起点依然是作用量 SS

S=mcdsS = -mc \int ds

我们利用线元公式 ds2=c2dt2dx2ds^2 = c^2 dt^2 - d\mathbf{x}^2 来建立 dsdsdtdt 的关系。

推导步骤:

  1. 从线元公式中提出 dt2dt^2 因子:

    ds2=c2dt2(1dx2c2dt2)ds^2 = c^2 dt^2 \left( 1 - \frac{d\mathbf{x}^2}{c^2 dt^2} \right)
  2. 开方得到 dsds

    ds=cdt11c2(dxdt)2ds = c \, dt \sqrt{1 - \frac{1}{c^2} \left( \frac{d\mathbf{x}}{dt} \right)^2}
  3. 引入3-速度 v=dxdt\mathbf{v} = \frac{d\mathbf{x}}{dt},其大小为 v=vv = |\mathbf{v}|。则 v2=vv=(dxdt)2v^2 = \mathbf{v} \cdot \mathbf{v} = \left(\frac{d\mathbf{x}}{dt}\right)^2。 同时定义无量纲速度 β=v/c\beta = v/c

    ds=c1β2dtds = c \sqrt{1 - \beta^2} \, dt
  4. 引入洛伦兹因子 γ=11β2\gamma = \frac{1}{\sqrt{1-\beta^2}},这是时间膨胀的因子。

    ds=cγdtds = \frac{c}{\gamma} dt

    这直接给出了固有时与实验室时的微分关系:dτ=ds/c=dt/γd\tau = ds/c = dt/\gamma

  5. dsds 的表达式代回作用量积分:

    S=mc(cγ)dt=(mc21γ)dt=(mc21v2c2)dtS = -mc \int \left( \frac{c}{\gamma} \right) dt = \int \left( -mc^2 \frac{1}{\gamma} \right) dt = \int \left( -mc^2 \sqrt{1 - \frac{v^2}{c^2}} \right) dt

根据作用量的定义 S=L(q,q˙,t)dtS = \int L(q, \dot{q}, t) dt,我们直接读出了一个自由粒子在实验室参考系下的相对论拉格朗日量

L=mc21v2c2=mc2γL = -mc^2 \sqrt{1 - \frac{v^2}{c^2}} = -\frac{mc^2}{\gamma}

2. 导出质能关系

现在我们有了拉格朗日量,就可以通过标准的分析流程导出物理量。

第一步:3-动量 p\mathbf{p} 动量定义为 p=Lv\mathbf{p} = \frac{\partial L}{\partial \mathbf{v}}

详细求导步骤:

p=v[mc2(1v2c2)1/2]=mc2(12(1v2c2)1/2)v(1vvc2)=mc2121β2(2vc2)=mc21β2vc2=m1v2/c2v=γmv\begin{aligned} \mathbf{p} &= \frac{\partial}{\partial \mathbf{v}} \left[ -mc^2 \left( 1 - \frac{v^2}{c^2} \right)^{1/2} \right] \\ &= -mc^2 \cdot \left( \frac{1}{2} \left( 1 - \frac{v^2}{c^2} \right)^{-1/2} \right) \cdot \frac{\partial}{\partial \mathbf{v}} \left( 1 - \frac{\mathbf{v} \cdot \mathbf{v}}{c^2} \right) \\ &= -mc^2 \cdot \frac{1}{2\sqrt{1-\beta^2}} \cdot \left( -\frac{2\mathbf{v}}{c^2} \right) \\ &= \frac{mc^2}{\sqrt{1-\beta^2}} \cdot \frac{\mathbf{v}}{c^2} \\ &= \frac{m}{\sqrt{1-v^2/c^2}} \mathbf{v} = \gamma m \mathbf{v} \end{aligned}

这正是我们熟知的相对论动量表达式。

**第二步:能量 EE ** 能量定义为汉密尔顿量 H=pvLH = \mathbf{p} \cdot \mathbf{v} - L

详细推导步骤:

  1. 代入 p\mathbf{p}LL 的表达式: E=(γmv)v(mc2γ)=γmv2+mc2γE = (\gamma m \mathbf{v}) \cdot \mathbf{v} - \left( - \frac{mc^2}{\gamma} \right) = \gamma m v^2 + \frac{mc^2}{\gamma}
  2. 通分合并: E=γ2mv2+mc2γ=m(γ2v2+c2)γE = \frac{\gamma^2 m v^2 + mc^2}{\gamma} = \frac{m (\gamma^2 v^2 + c^2)}{\gamma}
  3. 利用洛伦兹因子的恒等式 γ2=11v2/c2\gamma^2 = \frac{1}{1 - v^2/c^2} 进行化简。 从 γ2(1v2/c2)=1\gamma^2 (1 - v^2/c^2) = 1 出发,得到 γ2γ2v2/c2=1\gamma^2 - \gamma^2 v^2/c^2 = 1,移项得: γ2v2=c2(γ21)\gamma^2 v^2 = c^2 (\gamma^2 - 1)
  4. 将此结果代入能量表达式的分子: E=m(c2(γ21)+c2)γ=mc2(γ21+1)γ=mc2γ2γE = \frac{m (c^2(\gamma^2-1) + c^2)}{\gamma} = \frac{m c^2 (\gamma^2 - 1 + 1)}{\gamma} = \frac{m c^2 \gamma^2}{\gamma}
  5. 最终得到能量公式: E=γmc2E = \gamma m c^2

当粒子静止时 (v=0,γ=1v=0, \gamma=1),我们得到了静止能量(质能方程):

E0=mc2E_0 = mc^2

3. 图景总结

  1. 拉格朗日量的意义:相对论下的拉格朗日量 mc2/γ-mc^2/\gamma 不再是 TVT-V。它是一个与固有时流逝速率成正比的量。速度越快,γ\gamma 越大,固有时流逝越慢,mc2/γ-mc^2/\gamma 的绝对值就越小。
  2. 质能关系:能量 E=γmc2E = \gamma mc^2 包含了静止能量和动能。 E=E0+K=mc2+(γ1)mc2E = E_0 + K = mc^2 + (\gamma-1)mc^2 这意味着质量本身就是一种被“囚禁”的能量形式。加速一个物体,不仅仅是赋予它动能,也是在增加它的总能量,从而增加了它的惯性质量。

3. 双曲几何的视角

为什么会有 γ\gamma?为什么 uμuμ=c2u^\mu u_\mu = -c^2? 这一堆代数推导的背后,隐藏着时空的几何结构

如果我们画一个 (ct,x)(ct, x) 的二维时空图,所有不变量 s2=(ct)2x2=consts^2 = (ct)^2 - x^2 = \text{const} 构成了双曲线 (Hyperbola)

双曲时空
// FIG: 直观的几何
  • 欧氏旋转:在 (x,y)(x, y) 平面上,圆 x2+y2=r2x^2 + y^2 = r^2 不变,旋转保持模长。
  • 洛伦兹变换:在 (ct,x)(ct, x) 平面上,双曲线 (ct)2x2=s2(ct)^2 - x^2 = s^2 不变,洛伦兹变换本质上就是时空中的“双曲旋转”

一切都开始一目了然了。


END_OF_FILE