在引力波的研究中,真正称得上先驱及提出者的只有一个人,那就是爱因斯坦本人。
爱因斯坦的研究风格具有极强的系统性,在创立了广义相对论之后仅仅两年左右的时间,他就再接再厉地开辟了两个全新的分支领域:一个是相对论宇宙学,另一个就是引力波研究。爱因斯坦开辟的这两个领域后来都有了一些戏剧性的曲折,比如相对论宇宙学的发展在不久之后就使爱因斯坦所青睐的静态宇宙模型遭到了观测否决,而引力波的研究在爱因斯坦有生之年虽无观测数据,爱因斯坦自己的观点却几经变化。我们将在后文中陆续介绍爱因斯坦的观点变化,在本节中,让我们先上点“干货”,介绍一下广义相对论的弱场近似 (weak field approximation),对于引力波研究来说这是最便利的切入点,也是爱因斯坦研究引力波时最先考虑的情形。
有读者也许会问:讨论电磁波时从来也不需要弱场近似,为什么引力波研究要以弱场近似为切入点呢?这是因为电磁理论——确切地说是麦克斯韦的经典电磁理论——是一个线性理论,这种理论的基本特点是处理的难度与场的强弱无关,从而没必要对后者作出限制。但广义相对论不同,它是一个非线性理论,这种理论的一个基本特点是场具有所谓的自相互作用 (self-interaction),即场的产生不仅取决于源,而且还取决于它自身。这种自相互作用的存在使非线性理论的处理比线性理论困难得多,而且场越强,自相互作用往往越显著,处理的难度也就越大。那么非线性理论——或者具体地说,广义相对论这一非线性理论——该如何处理呢?一般来说,处理的手段有三类:一类是寻找特殊解,这类手段通常靠特定的对称性来简化问题,适用面比较小,但往往可以得到精确而解析的结果;另一类是数值计算,这类手段显著依赖于计算工具,在早期研究中基本缺席,在计算机技术日益发展的今天却有着越来越宽广的应用领域;第三类则是线性近似,这类手段的适用条件是非线性效应可以忽略,只要这一条件得到满足,它的适用面就是普遍的,不依赖于对称性,同时却往往可以得到解析结果。弱场近似下的引力波研究采用的就是第三类手段,因为弱场的自相互作用可以忽略,从而广义相对论可以近似为线性理论。
关于广义相对论的弱场近似,首先要问的是:什么是弱场?由于广义相对论将引力归结为时空的弯曲,而没有引力的时空是由闵科夫斯基度规 ημν 所描述的平直时空——也称为闵科夫斯基时空。因此所谓弱场显然是指时空偏离闵科夫斯基时空的幅度很小的情形。用数学语言来表示,广义相对论的弱场指的是形如
gμν = ημν + hμν (|hμν|≪1) (1)
的度规所表示的引力场——其中括号里的 |hμν|≪1 表示时空偏离闵科夫斯基时空的幅度很小。
将(1)式带入爱因斯坦场方程(2.9)式Rμν - (1/2)gμνR = 8πTμν[5],并且只保留 hμν 的线性项,可以得到
∂λ∂λhμν-∂λ∂μhλν-∂λ∂νhλμ + ∂μ∂νhλλ = ﹣16πG(Tμν -½ημνTλλ) (2)
需要说明的是,(2)式中 hμν 和 Tμν 的所有指标都是用闵科夫斯基度规ημν来升降的,因为否则就会引进 hμν 的非线性项。
(2)式虽然是线性的,却依然有相当的复杂性。幸运的是,我们还有一个“杀手锏”尚未使用,那就是广义相对论所具有的广义协变性。广义协变性使我们可以对4个时空坐标进行任意变换,而在那样的变换下,广义相对论中的度规、联络等都将发生相应的变化。利用这种变化,我们可以选择特殊的坐标,使得度规、联络等具有最易于处理的形式,这是研究广义相对论问题的重要技巧。熟悉电磁理论的读者也许看出来了,广义相对论所具有的广义协变性类似于电磁理论中的规范不变性(gauge invariance),对时空坐标的任意变换类似于电磁理论中的规范变换(gauge transformation),而由此带来的对度规、联络等的选择则相当于在电磁理论中选择规范条件(gauge condition)。所不同的是,电磁理论中的规范变换只涉及一个任意函数,相应的规范条件也只有一个,而广义相对论中的坐标变换涉及4个任意函数,从而可以导致4个类似的条件——称为“坐标条件”(coordinate conditions)。
坐标条件的选择不是唯一的,就像电磁理论中规范条件的选择不是唯一的。爱因斯坦在早年的研究中——包括理论框架完成之前的阶段里——往往只采用一个坐标条件,即 g = -1(其中g是度规张量 gμν 的行列式)。满足这一条件的坐标被称为“幺模坐标”(unimodular coordinates)。不过当他对弱场近似进行更系统的研究时,很快发现幺模坐标不适合研究引力波,因而自1916年6月发表引力波研究的第一篇论文“引力场方程的近似积分”(Approximative Integration of the Field Equations of Gravitation) 开始,转而采用了荷兰物理学家德西特 (Willemde Sitter) 提出的一组坐标条件:∂μ(hμν—½ημνhλλ) = 0。这组条件共有4个,从而充分利用了广义协变性带来的便利,满足这组条件的坐标被称为“各向同性坐标” (isotropic coordinates)。
利用各向同性坐标,爱因斯坦于1918年给出了有关弱场近似下引力波的若干重要结果。不过时隔一个世纪,我们已没有必要重复爱因斯坦的选择,而将采用一种更受现代研究者青睐的坐标条件:调和坐标条件(harmonic coordinate conditions,也称为“谐和坐标条件”)。用数学语言来表示,调和坐标条件指的是:
gμνΓλμν = 0 (3)
满足这组总计4个条件的坐标则被称为“调和坐标” (harmonic coordinates,也称为“谐和坐标”)。
调和坐标是20世纪20年代由比利时数学家德唐德 (Théophile de Donder) 和匈牙利物理学家兰佐斯 (Cornelius Lanczos) 彼此独立地提出的[6]。调和坐标条件作为一个坐标条件,本身并不受弱场近似的限制,但我们讨论的既然是弱场近似,则对调和坐标条件也需要作一个弱场近似,只保留hμν的线性项。不难证明,这种近似下的调和坐标条件(3)可以表述为:
∂μhμν = ½∂νhμμ (4)
细心的读者也许注意到了,(4)式跟前面提到过的各向同性坐标所满足的条件是完全相同的。因此调和坐标与各向同性坐标在弱场近似下是相同的,不过这种相同只限于弱场近似,在普遍情形下两者是不同的坐标。
利用(4)式可以很容易地证明——感兴趣的读者不妨自己试试——(2)式左侧除第一项外的其他三项相互抵消。由此我们得到一个高度简化了的、很漂亮的广义相对论弱场近似:
∂λ∂λhμν = -16πG(Tμν - ½ημνTλλ) (5)
这一近似之所以漂亮,是因为——读者想必认出来了——它正是所谓的波动方程 (wave equation)。这个波动方程所描述的是一种以物质——具体地说是 Tμν - ½ημνTλλ ——为源,以时空——具体地说是时空偏离平直的程度 hμν ——为波幅的波动。不仅如此,我们还可以立刻看出这种波动的一个重要特点,那就是传播速度是光速[7]。
如果说此前有关引力波的一切都是猜测,那么波动方程的出现改变了事情的性质。因为波动方程是波动的理论基础,蕴含着它的定量属性,也是定量验证的重要基础。对一般的物理体系来说,波动方程既然出现了,波的存在就不言而喻了,但我们将会看到,引力波跟一般的波相比有一些概念上的微妙性,一度甚至妨碍了爱因斯坦本人对它的理解和接受。