撰文:施郁(复旦大学物理学系教授)
摘要
:本文对物理学中的规范理论作了通俗介绍,然后讨论物理学中“规范”一词的起源。规范本来是尺子或者测度标准的意思。经典电磁学中使用“规范”一词是在外尔1928-1929年提出电磁场中量子带电粒子的规范原理之后。如果不是因为外尔曾经于1918-1919年作过失败的尝试,试图从时空中平行移动导致的尺度变化来导出电磁矢量势,那么后来人们就不会将“规范”一词用于电磁矢量势。本文也梳理了薛定谔、福克和伦敦的贡献。
关键词
:规范,电磁学,量子力学
1. 经典电磁学中的“规范”
从目前物理学的学习过程来说,“规范”一词首先在经典电磁学或者经典电动力学中出现。
电场强度
E
和磁感应强度
B
都可以用另外两个物理量,即矢量势
A
和标量势φ表达:
E
=-(1/c)∂
A
/∂t-gradφ , (1)
B
=curl
A
, (2)
这里c是光速,∂
A
/∂t是
A
对时间的导数,即随时间的变化率,grad和curl分别代表梯度和旋度。
现在介绍一下上一段出现的数学符号。黑体符号代表矢量,如
E
、
B
、
A
,是指一个既有方向,又有大小的物理量。非黑体符号代表标量,如φ,只有大小,没有方向。这些物理量都是空间和时间的函数。标量函数的梯度(grad)是一个矢量,它在任意方向的投影就是在这个方向的变化率。矢量函数的旋度(curl)也是一个矢量,它在任意方向的投影是它沿着围绕这个方向的一个无穷小闭合路径的积分,再除以所包围的小面积。
矢量
A
有3个空间分量,可以和φ统一看成一个4维矢量势,有4个时空分量,写作
(
A
0
,
A
1
,
A
2
,
A
3
)
其中
A
0
=φ是时间分量。这类似于时间和空间坐标可以写作4维时空坐标
(
x
0
,
x
1
,
x
2
,
x
3
)
其中
x
0
=ct。
在经典电磁学里,
A
不是可直接观测量,φ只有相对差可以测量,它们都有选择自由度。可以看出,如果由任意标量函数χ定义
A
’=
A
+gradχ, (3)
φ’=φ-(1/c)∂χ/∂t, (4)
那么用
A
’和φ’取代(1)和(2)式中的
A
和φ,直接可观测量电场强度
E
和磁感应强度
B
保持不变。
(3)和(4)被称作规范变换(gauge transformation)。在此规范变换下,
E
和
B
的不变性叫作规范不变(gauge invariance),也就是说在规范变换下的不变性。这两个名词是物理学的标准名词,被普遍使用。“规范变换”一词甚至被借用到广义相对论中。
1851年,汤姆森(William Thomson,即开尔文勋爵)首先通过(2)式定义了矢量势
A
。1856年,麦克斯韦(James Clerk Maxwell)提出法拉第(Michael Faraday)发现的感生电场由(1)式的第1项给出,而且确认
A
就是法拉第所说的电紧张密度(electrotonic density)
[1]
。1880年代,亥维赛(Oliver Heaviside)和赫兹(Heinrich Hertz)发现麦克斯韦方程可以不涉及
A
,完全由电场强度和磁场强度表达。杨振宁对这些历史有精彩的解说
[1]
。
2. 量子力学中的规范
简单地说,量子力学是描述微观粒子的一套运算规则。在量子力学中,中心概念是量子态。描述粒子在空间中的运动的量子态通常用复数波函数 ψ 表示,它是空间和时间的函数,它的模的平方代表几率密度。而可观测物理量,比如动量、角动量,都表示成作用在波函数上的算符。比如动量算符
p
等于(h/2πi)grad,能量算符 H 等于(ih/2π) ∂/∂t 其中 h 是普朗克(Max Planck)常数。与
A
和φ类似,
p
和H/c也可以统一看成一个4维动量算符,其中
p
是空间分量,H/c 是时间分量。
对于与电磁场耦合的电荷为q的粒子,动量算符
p
和能量算符 H 作如下改变
p
→
p
-q
A
/c, (5)
H →H+qφ。 (6)
甚至可以用gauge(规范化)作为动词指称这两个改变。
在量子力学中,非相对论性粒子的波函数服从薛定谔(Erwin Schrödinger)方程,相对论性粒子服从克莱因-戈登(Klein-Gordon)方程或者狄拉克(Paul Dirac)方程。在作变换(3)和(4)的时候,波函数也要相应地由原来的ψ做一个相位变换
ψ’=exp(2πiqχ/hc)ψ , (7)
从而波函数服从的运动方程保持不变,这就是规范不变性(gauge invariance),即规范变换下的不变性。χ 是时空坐标的函数,因此规范变换是定域的。如果 χ 是常数,那么相位变换(7)下的不变性是整体对称。量子力学与相对论相结合后,或者在多粒子系统的量子场论中,上面的波函数 ψ 要理解为量子场。
从(5)和(6)式可以得到,电磁场给其中的带电粒子的波函数带来一个由电磁势沿路径的积分所给出的相位因子,即
ψ→exp(2πiqS/hc)ψ, (8)
其中
S=∫A
1
dx
1
+∫A
2
dx
2
+∫A
3
dx
3
-c∫φdt
就是电磁势沿路径的积分。1959年,阿哈罗诺夫(Yakir Aharonov)和玻姆(David Bohm)发现这个相位因子有观测效应,即使在场强
E
和
B
消失的区域
[2]
。这确立了
A
和 φ 的物理实在性。
量子理论框架下的规范原理是外尔(Hermann Weyl)在1928-1929年确立的
[3,4,5]
。规范原理使得作为电磁场源的电荷的守恒成为规范不变性的后果,而且时空中每个点上都可以有定域规范变换。如果量子粒子不与电磁场耦合,那么就没有规范不变性,也就是说,与电磁场的耦合保证了规范不变性。为了有规范不变性,电磁场必须存在。因此人们说,电磁场是规范场。
规范场本身的量子化导致它对应的规范粒子,后者是前者的量子。电磁场的量子是光子,没有质量。
3. 杨-米尔斯理论
1950年代,各种奇异粒子的发现层出不穷,如何确定它们的相互作用成为一个重要问题。在此物理驱动下,1954年,杨振宁和米尔斯(Robert Mills)将外尔关于电磁场的规范理论推广为非阿贝尔(Non-Abelian)规范理论,也叫杨-米尔斯理论
[6,7]
。杨振宁和米尔斯强调,作为时空坐标的函数,规范变换是定域的。
在杨-米尔斯理论的最初形式中,波函数ψ被推广为有两个分量的波函数。基本粒子的量子态是两种基本内部状态的叠加状态,这两个分量波函数就是叠加系数。数学上可以将这两个分量波函数一起写成一个2行1列的矩阵。相应的规范变换(准确来说,应该叫相位变化)被推广为一个2行2列的矩阵变换,也就是说这个2行2列的矩阵乘以原来的二分量波函数,得到变换以后的新波函数。
做一个类比。一个平面上从坐标原点出发的矢量可以用两个坐标表示,这两个坐标可以写成一个2行1列的坐标矩阵。矢量绕着原点的转动就可以用一个2行2列的变换矩阵来表示。一个2行2列的变换矩阵乘以一个2行1列的坐标矩阵,就给出一个2行1列的新坐标矩阵,它的第一行等于变换矩阵第一行两个数与坐标矩阵的两个数分别相乘再相加,它的第二行等于变换矩阵第二行两个数与坐标矩阵的两个数分别相乘再相加。
连续作两次变换就是两个变换矩阵相乘。一般来说,矩阵相乘与顺序有关。数学上,与顺序无关的情况叫作阿贝尔(Abelian),与顺序有关的情况叫作非阿贝尔。所以杨-米尔斯理论又叫非阿贝尔规范理论。
在杨-米尔斯理论中,对于2分量波函数,引进与某个规范场的耦合,从而将规范场从电磁场推广到非阿贝尔规范场,保证定域规范不变性以及某种荷的守恒。
粒子与规范场的耦合与(5)和(6)类似。但是,因为粒子波函数是一个2行1列的矩阵,规范势的每个时空分量是一个2行2列的矩阵。杨振宁和米尔斯还给出了由规范势决定规范场场强的公式,以及粒子波函数与规范场的运动方程。
在电磁规范理论中,运动方程和电磁场场强都是规范不变的。而在杨-米尔斯理论中,规范场场强的每个时空分量都是一个2行2列的矩阵,它们在规范变换下是有变化的,不是规范不变的,不过,变换与波函数的变换相对应,有规范协变性(gauge covariance)。但是运动方程是规范不变的。非阿贝尔规范势的每个时空分量由内部状态空间中若干独立分量组合而成。独立分量的个数由规范对称性的数学性质决定。这导致规范粒子之间也有相互作用,这是与电磁场的一大区别。
1954年的时候,具体来说,杨振宁和米尔斯把定域规范场的思想用在强相互作用关于质子与中子的对称性,即同位旋守恒,就是说把质子和中子当作同种粒子的两个内部态。当时对于这种情况下规范粒子质量问题没有很好的结论,而且后来人们了解到同位旋守恒只是近似的。
但是杨-米尔斯规范理论为确定基本粒子的相互作用提供了一个基本原理
[8,9,10]
。本来,基本粒子之间的相互作用形式无法确定,杨-米尔斯规范理论规定了相互作用必须是什么样的。
后来杨-米尔斯规范理论成为描述弱电相互作用和强相互作用的基本理论框架,分别借助自发对称破缺和渐进自由,导致粒子物理的标准模型。
温伯格(Steven Weinberg)、格拉肖(Sheldon Glashow)和萨拉姆(Abdus Salam)等人各自在1960年代的工作最终确立了弱电理论。弱电理论的最后形式建立在杨-米尔斯规范理论和自发对称破缺机制的基础上。其中有两种规范场,一个是2行2列矩阵,在内部空间中有3个独立分量
W
1
、
W
2
、
W
3
,另一个规范场像电磁场那样在内部空间只有1个分量
B
。
W
1
和
W
2
的线性组合给出
W
+
和
W
-
,
W
3
和
B
的线性组合给出
Z
0
和电磁场。
W
+
、
W
-
和
Z
0
的规范粒子质量通过自发对称破缺获得,即所谓的安德森-布劳特-恩格莱特-希格斯(Anderson-Brout-Englert-Higgs)机制。电磁场的规范粒子光子无质量。1983年,
W
+
、
W
-
和
Z
0
在CERN被鲁比亚(Carlo Rubbia)等人观测到。
描述夸克之间强相互作用的杨-米尔斯规范理论被创始人之一盖尔曼(Murry Gell-Mann)称作量子色动力学,其中的规范场是胶子场,与夸克的色自由度耦合。色与弱电理论无关。夸克还有个自由度叫作味,与弱电理论相关,而与色动力学无关。每种味的夸克都有3种色,因此色波函数是3行1列的矩阵,胶子场是3行3列的矩阵,在色空间中有8个独立分量(可以说是8种胶子)。带色的规范粒子胶子确实如杨-米尔斯理论原本所述,没有质量,但是通常与夸克一起被禁闭在强子中而不能被孤立出来。
4. 为什么要用“规范”这个词
规范变换(7)实际上是个相位变换,规范场是相位场。那么为什么要用“规范”这个词呢?是因为原先在经典电磁学里,(3)和(4)就被称作规范变换吗?
与直觉的推测相反,答案是否定的。
事实上,这是因为外尔1928-1929年的理论是他1918-1919年理论的修正,而后者所讨论的是名副其实的规范不变性。
1918-1919年,受爱因斯坦广义相对论的鼓舞,外尔试图用几何的方法导出电磁场,以便与引力统一。考虑在时空中的平行移动,广义相对论说时空的弯曲导致矢量方向有变化,而外尔猜想电磁势导致沿路径的积分给出一个时空变化因子。但是与后来1928-1929年理论不同,这个因子的指数上没有虚数单位 i,因此不是相位因子,而是标度因子,确实是所谓的“规范”因子。“规范”本是尺子或者测度标准的意思。外尔1918-1919年的理论遭到了爱因斯坦的反对。
外尔1918-1919年的理论建立在3篇论文的基础上
[11,12,13]
。杨振宁注意到
[14]
,外尔在前两篇论文中,用的名词是masstab invarianz,翻成英文是measure invariance(测定不变性),在第三篇论文中,他用的名词是eich invarianz,而eich invarianz在1921年被翻译为英文calibration invariance。杰克孙(John David Jackson)和奥肯(Lev B. Okun)注意到
[15]
,英文gauge invariance 后来首先出现在外尔本人1929年的英文文章中
[4]
。Eich invarianz,calibration invariance或者gauge invariance就是中文的“规范不变性”。
1922年,薛定谔猜测可以在外尔的规范因子的指数里加上虚数单位i
[16]
。
1922年,卡鲁扎(Th. Kaluza)提出5维时空理论,第5维与4维时空之间的度规系数由电磁势给出。
1926年,薛定谔的4篇系列文章创立了波动力学(与矩阵力学同为当时量子力学的两种形式),这4篇文章分别于1月27日、2月23日、5月10日、6月23日被杂志社收到
[17,18,19]
。薛定谔的这4篇论文中都没有提到他1922年修改外尔理论的工作。但是在第4篇论文中,薛定谔指出在电磁场中,带电粒子的动量和能量算符必须如我们上面的(5)和(6)式
[20]
。
也是1926年,在薛定谔的波动力学工作带领下,克莱因(Oskar Klein)和福克(Vladimir Fock)分别独立讨论了卡鲁扎理论框架下的波动力学。福克的论文7月24日被杂志社收到得到,文中在得到波函数运动方程后,又指出在变换(3)、(4)、(7)下的不变性,也就是我们现在所说的规范不变性
[21]
。
当年12月10日左右,伦敦(Fritz London)写了一封幽默的信给薛定谔,提到后者1922年修改外尔规范因子的工作,并敦促他阐明与波动力学的联系
[22,23]
。
1969年拉曼(V. V. Raman)和福曼(P. Forman)挖掘出这封伦敦致薛定谔的信后,人们发现,薛定谔1922年的工作对他创立波动力学确实起了作用,他1925年11月致爱因斯坦的一封信就提到德布罗意理论与外尔理论的联系
[23,24]
。