1. 寻找不变量
在经典力学中,L=T−V 似乎是天经地义的。但在相对论视角的分析力学中,我们必须重新审视作用量 S 的定义。
物理定律在洛伦兹变换下应当保持形式不变,而作用量始终取极值,这意味着作用量 S 必须是一个标量,即在所有惯性系下取值相同。
在闵可夫斯基时空中,最自然的几何不变量就是世界线的长度(ds)。
对于有质量粒子,其世界线是类时的,因此我们定义作用量与路径长度成正比。
为了量纲匹配(作用量量纲 [Energy]⋅[Time])并回退到经典极限,我们引入系数 −mc:
S=−mc∫ds
Why negative? 在欧几里得几何中,两点之间直线最短;但在闵氏时空,对于类时路径,直线(惯性运动)的固有时最长。为了符合最小作用量原理,我们需要加负号求极大值。
2. 固有时 τ and 实验室时间 t
与牛顿力学不同,相对论中没有绝对时间。我们面临两个选择来参数化这条世界线:
- **固有时 τ **:粒子随身携带的时钟。
- 实验室时间 t:观测者的时间,取决于参考系。
2.1 方案 A:以固有时 τ 为参数(协变形式)
1. 几何背景与定义
-
度规符号:采用常用的 ημν=diag(−1,1,1,1)。
-
线元:时空间隔的平方定义为:
ds2=−ημνdxμdxν=c2dt2−dx2
对于有质量粒子的真实运动(类时世界线),ds2>0。
-
固有时 (Proper Time):定义 dτ=ds/c。它是粒子系本身感受到的时间流逝。
-
4-速度 (4-Velocity):定义为坐标对固有时的导数:
uμ=dτdxμ
// ANNOTATION
推导 4-速度的模长恒等式:
将线元公式两边同除以 dτ2:
dτ2ds2=−ημνdτdxμdτdxν左边根据定义是 c2,右边正是 −uμuμ(或写作 −u2)。于是我们得到一个极其重要的几何约束:
uμuμ=−c2这意味着 4-速度是一个模长恒定的矢量。
// Note: 推导 4-速度的模长恒等式:
将线元公式两边同除以 dτ2:
dτ2ds2=−ημνdτdxμdτdxν左边根据定义是 c2,右边正是 −uμuμ(或写作 −u2)。于是我们得到一个极其重要的几何约束:
uμuμ=−c2这意味着 4-速度是一个模长恒定的矢量。
2. 作用量与拉格朗日量
我们从最小作用量原理出发,假设作用量 S 正比于世界线的长度:
S=−mc∫ds
利用 ds=−ημνdxμdxν,我们将积分变量变换为固有时 τ。注意到 dxμ=uμdτ,则:
ds=−ημν(uμdτ)(uνdτ)=−uμuμdτ
于是作用量写为:
S=∫(−mc−uμuμ)dτ
由此,我们直接读出了相对论协变形式的拉格朗日量:
L(xμ,uμ)=−mc−uρuρ
2.1 广义动量
根据定义,共轭动量是拉格朗日量对广义速度(这里是 uμ)的偏导数:
pμ=∂uμ∂L
我们需要计算 ∂uμ∂(−mc−uρuρ)。
令 K=−uρuρ=−ηαβuαuβ。则 L=−mcK。
有:
∂uμ∂L=−mc⋅dKd(K)⋅∂uμ∂K
第一部分:
dKd(K)=2K1=2−u21
第二部分:
∂uμ∂K=∂uμ∂(−ηαβuαuβ)=−ηαβ(∂uμ∂uαuβ+uα∂uμ∂uβ)
然后 ∂uμ∂uα=δμα:
=−ηαβ(δμαuβ+uαδμβ)=−(ημβuβ+ηαμuα)=−(uμ+uμ)=−2uμ
合并:
将两部分乘起来:
pμ=−mc⋅2−u21⋅(−2uμ)=−u2mcuμ
代入条件:
虽然在变分过程中 uμ 是独立变量,但在物理运动实现后,必须满足约束 −u2=c。代入消去 c:
pμ=cmcuμ=muμ
这就是我们熟悉的 4-动量定义。
2.2 E-L方程求解
给出E-L方程:
dτd(∂uμ∂L)−∂xμ∂L=0
- 动量项:我们已经算出 ∂uμ∂L=pμ=muμ。
- 力项:观察 L=−mc−u2,它不显含坐标 xμ(因为我们假设时空是平坦的,ημν 是常数)。因此:
∂xμ∂L=0
于是方程简化为:
dτd(muμ)=0⇒dτdpμ=0
2.2 方案 B:以实验室时间 t 为参数(3+1 形式)
虽然固有时 τ 在理论上很优美,但在实际实验中,我们测量的是实验室坐标时 t 和空间位移 dx。为了将理论与观测联系起来,我们需要将作用量 S 用实验室变量表示。
1. 拉格朗日量的推导
我们的起点依然是作用量 S:
S=−mc∫ds
我们利用线元公式 ds2=c2dt2−dx2 来建立 ds 和 dt 的关系。
推导步骤:
-
从线元公式中提出 dt2 因子:
ds2=c2dt2(1−c2dt2dx2)
-
开方得到 ds:
ds=cdt1−c21(dtdx)2
-
引入3-速度 v=dtdx,其大小为 v=∣v∣。则 v2=v⋅v=(dtdx)2。
同时定义无量纲速度 β=v/c。
ds=c1−β2dt
-
引入洛伦兹因子 γ=1−β21,这是时间膨胀的因子。
ds=γcdt
这直接给出了固有时与实验室时的微分关系:dτ=ds/c=dt/γ。
-
将 ds 的表达式代回作用量积分:
S=−mc∫(γc)dt=∫(−mc2γ1)dt=∫(−mc21−c2v2)dt
根据作用量的定义 S=∫L(q,q˙,t)dt,我们直接读出了一个自由粒子在实验室参考系下的相对论拉格朗日量:
L=−mc21−c2v2=−γmc2
// ANNOTATION
经典极限的检验:
当速度 v≪c 时,我们可以对 L 进行泰勒展开:
L=−mc2(1−c2v2)1/2≈−mc2(1−21c2v2)=−mc2+21mv2−mc2 是一个常数,在拉格朗日方程中会被消去。剩下的 21mv2 正是经典力学中的动能。这验证了我们定义的正确性。
// Note: 经典极限的检验:
当速度 v≪c 时,我们可以对 L 进行泰勒展开:
L=−mc2(1−c2v2)1/2≈−mc2(1−21c2v2)=−mc2+21mv2−mc2 是一个常数,在拉格朗日方程中会被消去。剩下的 21mv2 正是经典力学中的动能。这验证了我们定义的正确性。
2. 导出质能关系
现在我们有了拉格朗日量,就可以通过标准的分析流程导出物理量。
第一步:3-动量 p
动量定义为 p=∂v∂L。
详细求导步骤:
p=∂v∂[−mc2(1−c2v2)1/2]=−mc2⋅(21(1−c2v2)−1/2)⋅∂v∂(1−c2v⋅v)=−mc2⋅21−β21⋅(−c22v)=1−β2mc2⋅c2v=1−v2/c2mv=γmv
这正是我们熟知的相对论动量表达式。
**第二步:能量 E **
能量定义为汉密尔顿量 H=p⋅v−L。
详细推导步骤:
- 代入 p 和 L 的表达式:
E=(γmv)⋅v−(−γmc2)=γmv2+γmc2
- 通分合并:
E=γγ2mv2+mc2=γm(γ2v2+c2)
- 利用洛伦兹因子的恒等式 γ2=1−v2/c21 进行化简。
从 γ2(1−v2/c2)=1 出发,得到 γ2−γ2v2/c2=1,移项得:
γ2v2=c2(γ2−1)
- 将此结果代入能量表达式的分子:
E=γm(c2(γ2−1)+c2)=γmc2(γ2−1+1)=γmc2γ2
- 最终得到能量公式:
E=γmc2
当粒子静止时 (v=0,γ=1),我们得到了静止能量(质能方程):
E0=mc2
3. 图景总结
- 拉格朗日量的意义:相对论下的拉格朗日量 −mc2/γ 不再是 T−V。它是一个与固有时流逝速率成正比的量。速度越快,γ 越大,固有时流逝越慢,−mc2/γ 的绝对值就越小。
- 质能关系:能量 E=γmc2 包含了静止能量和动能。
E=E0+K=mc2+(γ−1)mc2
这意味着质量本身就是一种被“囚禁”的能量形式。加速一个物体,不仅仅是赋予它动能,也是在增加它的总能量,从而增加了它的惯性质量。
3. 双曲几何的视角
为什么会有 γ?为什么 uμuμ=−c2?
这一堆代数推导的背后,隐藏着时空的几何结构。
如果我们画一个 (ct,x) 的二维时空图,所有不变量 s2=(ct)2−x2=const 构成了双曲线 (Hyperbola)。
// FIG: 直观的几何
- 欧氏旋转:在 (x,y) 平面上,圆 x2+y2=r2 不变,旋转保持模长。
- 洛伦兹变换:在 (ct,x) 平面上,双曲线 (ct)2−x2=s2 不变,洛伦兹变换本质上就是时空中的“双曲旋转”。
一切都开始一目了然了。