物理学探索自然界的奥秘,有三个基本的认识发展方向。对于微观世界的研究,从分子、原子、原子核到 “基本” 粒子,涉及越来越小的时间和空间尺度,其小无内,不可穷尽。引力理论、天体物理,探讨大范围的宇观的时空结构和物质运动,其大无外,同样不可穷尽。另一方面,“一生二、 二生三、 三生万物”,量的变化导致物质运动由简单到复杂、由低级到高级的各种形态和阶段,直至生命和意识,这个发展过程同样是没有止境的。基础自然科学的多数分支,其实都是以第三个发展方向为对象。物理学研究的只是其中比较初始因而也更为基本的过程。统计物理学则在宏观与微观描述之间、物理学和其他学科之间,起着一种桥梁作用。本文拟从几个侧面, 粗浅地讨论一下统计物理学的对象和方法,介绍它的一些概念与范畴。
郝柏林
| 作者
中国科学院理论物理研究所,
原载于
《
自然杂志
》
| 来源
分子、 原子、 原子核、 电子以及其他各种 “基本” 粒子, 作为物质结构的单位是人们所熟悉的, 它们又是物质运动的单位, 而且在一定的相互作用条件下, 组成与结构单位并不等同的运动单位。例如, 金属中的电子通过与组成晶格骨架的原子核的相互作用, 可以在条件适合时产生有效的相吸作用, 成双配对地运动。又如, 一个在固体中运动的电子, 可以使周围的晶格稍有畸变, 它走到哪里畸变随到哪里, 宛如一个更复杂的粒子。这样的运动单位有自己的动量、 能量、 相当长的寿命, 甚至独特的光谱线等, 通常称之为 “准粒子” 或 “元激发”。各类宏观物体中的准粒子名目繁多:声子、 极化子、 激子、 等离激元、 超导金属中的电子对、 液氦中的旋子……它们与作为物质结构单位的粒子有一个根本区别, 就是不能离开环境独立存在。然而它们作为物理对象的确定性, 并不亚于任何 “基本” 粒子。
无论粒子或准粒子, 都可能有许多不同的运动方式:前后、 上下、 左右的平动, 各种振动和转动, 还可能有一些不那么直观的内在运动和集体运动。每一种运动方式叫作一个自由度。统计物理的研究对象, 就是由大量粒子、 准粒子组成, 具有大量自由度的系统。由于它突出抓住 “大量” 这一特点, “微观” 和 “宏观” 的划分也就更为相对, 通常首先不是指物质结构的层次, 而是用以区别物理描述的层次。
现代自然科学使人类对自然界的认识跨越了很大的时空尺度。
空间范围从基本粒子 “内部” 的10
-15
厘米, 到现代天文观测手段所及的一百亿光年
10
28
厘米, 相去
10
43
倍。时间范围从强子寿命
10
-23
秒, 到我们所知的这一部分宇宙的寿命一百亿年即
10
17
秒, 也差
10
40
倍。物理思维中常把10倍左右的数量变化忽略掉, 视为同一个 “量级”。现代科学所知的物理世界,在时间和空间两方面都跨越了40个量级。然而就我们对物理世界的描述而言,必须把这几十个量级划分成许许多多的层次。这不仅是因为物质的结构和运动本来表现出阶段和层次, 而且因为我们的每种观测手段, 从高能加速器到射电望远镜, 都局限于某些层次。尺有所短, 寸有所长。每种物理仪器都有它所瞄准的主要层次,虽然有一定的调整变化余地
(“动态范围”)
,也不可能跨越许多个量级。同时,每种仪器还有其观测精度或分辨能力, 超乎这一限度的物质运动必须改用其他手段研究。这有如用放大镜看油画, 作品的整体结构和主题自然是在视野之外, 颜料和画布的分子结构也还无法觉察。描述层次的划分,可以举两个极端的例子。研究银河系的旋臂结构, 把单个天体看成 “微观” 粒子,讨论这种粒子组成的连续的气体中物质的运动和分布;研究单个原子核或基本粒子,为了强调其内部的无限多自由度, 又可以把它看成 “宏观” 系统, 和液滴类比等,这两个例子都可引用统计物理的概念和方法来处理。
描述单个或少量粒子的运动和相互作用的科学,可以统称之为“力学”。无论是描述天体运行的经典力学、反映电子运动的量子力学、表征电子与电磁场相互作用的量子电动力学,包括相对论力学,从统计物理的观点看来, 都是 “微观” 理论。即使我们透彻地掌握了它们, 同时还知道了粒子间的全部相互作用力, 也不可能直接运用这些规律来刻画宏观物体的性质, 即使可以写出来全部方程, 也无法准确知晓和利用全部初始条件来求解这些方程。
应当强调指出,这并不仅仅是一种技术性的困难。“大量” 相互作用粒子的行为, 出现本质上新的特点, 我们的认识和描述方法也必须做质的改变。一滴水里面有近百万亿亿个分子,一片最纯的半导体中杂质原子的数目仍有成千上万亿。每立方厘米普通液体或固体中的原子数目大致是
10
23
的量级。即使是所谓 “稀薄” 气体或“低密度” 等离子体, 其中每一块小体积中的粒子数目, 至少仍要以亿计量。这些数量是如此之大, 以至于把它们看成 “无穷大” 往往更合乎实际一些。统计物理中常令粒子数和系统的体积趋向无穷大,但保持单位体积内的粒子数有限,这叫热力学极限。只有取了热力学极限之后, 许多数量关系才得以简化, 物理图像也更为清楚。
为了得到一些启示, 设想一个粒子在三角形三个顶点之间随机跳跃
三种可能的初始状态, 即粒子处于第1、2或 3点上, 可以用三个矢量(1,0,0)、(0, 1, 0)、(0, 0, 1)代表。如果粒子现在处于某点, 则一次跳跃后它必定离开此点, 以各为1/2 的概率达到另外两点之一。新的状态可以用一个方阵
( “转移矩阵”)
乘代表初始状态的矢量来得到。 例如
从任何给定的状态出发, 经过N次跳跃后达到各点的概率, 都可以用转移矩阵乘N次求得。计算虽不难, 但每种具体条件都有其特殊的答案。然而有一种情形却很简单, 那就是不论从什么状态出发, 经过无穷多次跳跃后, 粒子达到每个点的概率都是1/3。事实上也很容易证明, 转移矩阵的无穷次方是
统计物理学中的热力学极限当然更为复杂。然而这个随机过程的简例, 反映了统计物理的一种基本精神:研究那些不受具体初始条件影响的普遍性质。“大量” 这个背景, 使我们从微观物理出发研究宏观系统的性质时引用概率统计方法, 如同力学中使用微分方程一样自然和精确。统计物理学的名称也就由此而来。它并不是一门新学科,19世纪麦克斯韦
(J.K. Maxwell)
和玻尔兹曼
(L.E.Boltzman)
研究气体动理学理论是它的诞生,20世纪初在吉布斯
(J.W.Gibbs)
和爱因斯坦的工作中已经形成它的理论体系。它作为无穷多自由度系统理论的威力, 则是近20多年来在与量子场论的互相影响中逐步显现出来。
一个 “层次”, 一个 “大量”, 抓住这两条才能理解统计物理学的特殊地位。它并不像原子或分子物理学那样具有确定的研究领域。任何由大量较小的单位或层次组成的系统, 都可以成为统计物理学讨论的对象。正是在这个意义上, 我们说统计物理学既是物理学, 又是方法论。作为物理学, 它的主要对象是气体、 液体、 固体、 等离子体等 “多体系统”, 也涉及更复杂的化学和生物过程;作为方法论, 它探讨如何从单个或少量粒子的运动规律出发, 以概率统计的方法推断和说明由大量粒子组成的物体的性质。也正是由于 “大量” 这一特殊的矛盾, 使得量子力学的创立并未从根本上改变统计物理学的理论体系。微观粒子的行为和不可区分性, 以新的统计分布
(玻色 爱因斯坦分布和费米 狄拉克分布)
丰富了统计物理学的内容, 自然地解决了经典统计中曾经存在的一些困难, 例如由粒子的不可区分性说明了原来推导中需硬行引进的 N! 因子。从基本精神看, 统计物理学与量子力学更为一致。量子力学的诠释受益于统计观念, 这是大家所熟悉的。近几年的研究表明, 甚至处理纯经典的具有无穷多自由度系统的涨落时,也要自然地引入不对易的算子,遇到某种不含普朗克常量的波动力学。这方面的研究,还在继续 。
大量相互作用粒子组成的系统,有哪些本质上不同于力学系统的新的行为呢?至少可以指出三类:一是出现不平衡、 不可逆的过程;二是在温度或其他参数改变时系统的状态会发生突变;三是出现大量粒子协同动作才可能产生的有序和结构。
历史上统计物理学的任务首先在于说明平衡态的性质。早在人类认识物质的微观结构之前, 就形成了描述宏观物体的科学体系。这就是使用体积、 温度、 压力、 比热、 压缩率、 膨胀率等可以测量的参数,坚持能量守恒、 热过程不可逆等基本规律的热力学体系。热力学主要描述平衡态。对于非平衡态, 它除了指出孤立系统最终必须趋向平衡外, 几乎没有给出更为积极的知识。平衡态的统计物理学, 作为热力学的微观基础, 已经是发展完备的理论。除了少数孤立难题和它本身的理论基础所引起的数学问题外, 平衡统计目前并不是活跃的研究领域。研究重心早已转入非平衡现象, 我们在后面再谈。为了说明平衡态统计的基本方法, 不妨先介绍一个至今悬而未决的难题。
解决任何一个平衡统计问题的过程, 可以归结为如下三部曲:第一步是求解一个 “力学” 问题, 得到系统的能量谱En, 它可能依赖于一些参数;第二步是对一切可能的能量状态计算如下的指数和
其中T 是绝对温度, k是玻尔兹曼常量, Z称为配分函数或统计和;第三步是建立与热力学的关系, 实际上就是把指数和换成单个指数, 令Z=e
-F/kT
, F就是热力学中的自由能。一切热力学量都通过求F对各个参数的导数得到, 而不需使用其他运算。除了理想气体等少数特例, 真正用这个三部曲得到解决的实际问题微乎其微。因为第一步并非统计的力学问题, 对于多粒子系统已经极难求解, 而第二步的数学困难很大, 通常要靠各种近似方法或避开计算去寻求定性结论。
由于指数是极为光滑的连续函数, 求和更使函数的性质变好,历史上对这一套三部曲的严重怀疑, 就在于它能不能说明磁铁在升温过程中突然失去磁性这类相变现象, 以及相变点附近许多物理性质的反常。为了试图回答这个责难, 伊辛
(E. Ising)
在1925年提出一个非常简单的统计模型。在晶体的每个格点犻上放一个磁矩σ
i
。它可以有向上(σ
i
=1)或向下(
σ
i
=-1) 两种取向。只考虑最近邻磁矩的相互作用, 当它们取向相同(σ
i
σ
j
=1)时, 能量是负J,而取向相反(σ
i
σ
j
=-1) 时, 能量是J。这样就绕过了力学问题,直接给出了能谱
其
中字母σ代表各个格点上的σ
i
取+1或-1的一种具体分布方式。
计算配分函数
的手续并不简单。伊辛本人只解决了一维链
(即磁矩排列成一条直线)
的情形, 发现没有相变。他还给出一些似是而非的论据, 说明二维和三维情形下也不会有相变。直到1944年昂萨格
( L.Onsager)
以精美的数学技巧解出了二维伊辛模型, 人们才明白二维是有相变的, 但比热尖峰
(图2)
只有在取了热力学极限之后才突出起来。这是平衡态统计物理的一项辉煌成就, 是后来授予昂萨格诺贝尔奖奖金的根据之一
(注[1])
。 杨振宁对于二维伊辛模型也做过重要贡献。然而半个多世纪以来一直未能严格计算出更为实际的三维伊辛模型, 甚至连解决途径也不清楚。
非平衡统计问题的提出虽然与平衡问题同样悠久
,
但是直到近几十年才逐渐形成一些重要概念
,
勾画出理论体系
。
一个稳定的平衡态附近
,
主要的趋势是走向平衡
。
如果对系统施以短暂的扰动
,
则取消扰动后系统经一段时间后就重新回到平衡
。
所需的这一段时间称为弛豫时间
,
这类过程称为弛豫过程
。
如果强行维持使系统处于不平衡的外界条件
(“
力
”)
,
则系统的响应是产生持续不断的
“
流
”。
例如
,
维持电位差
,
导致电流
;
保持温度差
,
出现热流
;
造成浓度差
,
形成粒子流
......
这些流就是电荷
、
能量
、
质量等的转移
,
是要消耗能量的
。
这类过程称为输运过程或耗散过程
。
如果离开平衡不远,
“
流
”
和
“
力
”
是成比例的
,
比例系数是物质本身的 一种宏观参数
,
称为输运系数
。
电导率
、
热传导系数
、
黏滞系数等
,
都是输运系数
。
宏观的平衡态
,
对应瞬息万变的微观运动方式
,
是微观运动的一种平均的表现
。
因此各种宏观参数总是在平均值附近起伏摆动
。
如果对系统中
“
微观大
,
宏观小
”
的部分做测量
,
则这种围绕平均值的涨落尤为清楚
。
弛豫
、
输运
、
涨落是平衡态附近主要的非平衡过程
,
它们都是由趋向平衡这一总的倾向决定的
,
因而有深刻的内在联系
。
非平衡统计物理的重要成果
,
是证明了输运系数对称原理和涨落耗散定理
。
输运过程可以错综复杂地进行
。
例如
,
温度差不仅直接引起热流
,
还可以引起质量流
(
这就是用于同位素分离的热扩散
)
、
电流
(
温差电效应
)
等
,
另一方面浓度差不仅造成扩散流
,
还能引起扩散热
。
如果适当选择物理量
,
则甲种力形成的乙种流
,
乙种力导致的甲种流
,
这两个交叉的输运过程
,
其输运系数是相等的
。
这就是输运系统对称原理
。
其实早在
1854
年汤姆孙
(
W.Thomson
)
用热力学方法分析热电效应时
,
就建立了第一个这种对称关系
,
但是这一原理的普遍证明则是
1931
年昂萨格给出的
。
涨落耗散定理说明
,
输运系数由相应物理量的涨落平均值决定
。
1928
年证明电路中热噪声形成的随机电动势的平均值与元件的电阻
(
这也是输运系数
)
成正比,这也就是 涨落耗散定理的一种表达
。
1905
年爱因斯坦研究布朗运动时
,
把它与扩散系数联系起来
,
也是另一种意义上的涨落耗散定理
。
定理的一般证明
,
20
世纪
50
年代才臻于完备
。
关于平衡与非平衡的描述
,
与物理世界时间层次的划分有密切关系。
如果考察气体分子的碰撞过程,
它持续约
10
-13
~
10
-12
秒,
这里只能使用微观的力学描述
。
碰撞过程的
“
力学
”
总是可逆的
。
相对于两次碰撞之间的自由飞行时间
(
10
-9
~
10
-8
秒
)
而言
,
碰撞过程可以略而不计
。
输运系数对称原理就是在这一描述水平上证明的
。
这时可以看到
,
输运系数虽然出现在不可逆过程中
,
对称原理本身却恰恰是微观运动可逆性的表现
。
如果进一步忽略碰撞间隔
,
只关心宏观状态发生显著变化的时间尺度
,
例如流体各部分温度达到平衡的时间
,
我们就采用了与热力学类似的宏观描述
。
流体力学就是这样的体系
,
它只剩下五个量来代表每个
“
微观大
、
宏观小
”
范围内的运动自由度
。
从统计物理出发
,
我们不仅知道了流体力学方程中的黏滞系数等怎样与微观描述发生联系
,
还懂得如何改进这些方程本身,
我们并不是说宏观不可逆性是随着描述层次变粗才出现的
,
而是强调要正确反映客观存在的不可逆性
,
我们必须采用较粗的描述方式
。
这个由细到粗
、
由微到宏的过程
,
正是统计物理的研究对象
。
平衡态比较单纯
,
非平衡态丰富多彩
。
只考虑平衡附近的现象
,
只抓住趋向平衡这一种倾向
,
统计物理就是极不完全的理论
。
我们必须往远离平衡的方向前进
。
初看之下
,
这里有千奇百怪的自然现象
,
似乎很难建立统一理论
。
事实上直到现在还不清楚
,
能否把类似输运系数或涨落耗散定理这样的概念普遍地推广到离平衡较远的状态
。
然而离平衡足够远时
,
出现了新的现象
:
有些宏观系统突然进入新的更有序更有组织的状态
。
出现这些状态的条件各不相同
,
但有一些共同的规律
。
第一
,
通常有某个参数达到一定阈值
,
新状态
才突然出现
。
这是一种临界现象
,
很像普通平衡态下的相变
。
第二
,
新状态具有更丰富的时间和空间结构
,
例如呈现周期变化或宏观尺度上的花纹图案
。
第三
,
只有不断从外界提供能量
,
这些结构才能维持下去
。
第四
,
新结构一旦出现
,
就具有和平衡态类似的稳定性
,
不容易因外界条件的微小改变而消失
。
这类现象目前常称为
“
耗散结构
”,
在日常生活中也能遇到
。
质量欠佳的日光灯管
,
在一定条件下突然进入辉纹放电状态
,
出现黑白相间的条纹
,
有时这些条纹还沿着灯管运动
,
这就是一种耗散结构
。
这是非平衡统计物理中迅速发展的新的一章
。
生物体是不是更高级的耗散结构
?
也许这里会打开一条通向生命科学的道路
。
现在我们有了比较完整的图像
:
平衡附近是以趋向平衡为主的各种过程
,
远离平衡时可能经过突变形成耗散结构
。
这两个在一定意义上相反的过程都是宏观系统所特有的
。
无论平衡态的相变
,
还是远离平衡的突变
,
有序和结构的出现
,
通常都伴随着对称的改变
。
其实
,
最对称的世界是没有任何秩序和结构的
。
那是在
“
盘古开天地
”
之前
,
天地混沌
,
无所谓上下
、
左右
,
没有任何特殊方向和特殊点
,
也无从区分过去和未来
。
一切
“
对称操作
”
都是允许的
,
有无穷多种
“
对称元素
”。
一旦可 以看到
“
对称
”,
有一个立方或六角晶体摆在我们面前
,
已经是失去了不计其数的对称元素
,
只剩下寥寥数十个
。
首先明白这一点的
,
可能是老居里
(
P.Curie
)
,
他曾经有过
“
非对称创造了世界
”
的妙语
。
更复杂的物质结构形式
,
其实没有任何原来意义下的对称
,
但是又有着大量局部的
、
近似的对称性质
。
对称变换在统计物理中
,
如同在理论物理的其他分支中一样
,
起着重要的建设作用
。
我们结合这一点
,
介绍近几年统计物理学中一项重要突破
——
重正化群概念的引入
。
先考虑一类具有自相似性的几何图案
。
请看图
3
,
其中每个方框内套有四个小方框
,
如此无限嵌套下去
,
每个黑点内部还有无穷多同样的结构
,
而图
3
本身只不过是更大的方框中的一个小框
。
整个图形往大小两个方向无限地重复下去
,
把它适当地放大或缩小若干倍
,
都可以和原有图形重合
。
连续放大两次的效果
,
也能用一次 放大做到
。
我们说
,
这个图案有一个自相似变换群
。
如果加一条限制
:
只许不断缩小尺度
,
但不准放大
,
方框小到一定程度就把它抹黑
,
不再分辨其内部结构
。
这样就只剩下单方向的自相似变换
,
这是一个
“
半群
”。
这里的
“
抹黑
”,
很像统计物理学中的平均
,
带来了某种不可逆性的味道
。
这种几何游戏式的考虑
,
在统计物理学中找到了重大应用
。
取一块相当大的磁铁
(
把它看成无穷大
!
)
,
在温度远高于相变点时
,
其中磁矩的排列是完全混乱的
,
表现不出宏观的磁性
。
当温度下降
,
接近相变点时
,
每个磁矩的影响范围都逐渐扩大
,
要求其他磁矩采取与自己平行的取向
。
这个影响半径又称为关联长度
。
到了相变点
,
关联长度成为无穷长
,
于是整个晶体内的磁矩突然沿一个方向排列好
(
究竟沿哪个方向,倒是由偶然因素决定的
)
。
设想在很接近相变点处用统计物理的方法研究这块磁铁
,
把单个磁矩间的相互作用能量写出来
,
然后计算配分函数
。
这很像前面介绍过的伊辛
模型
。
原则上也可以把每四个磁矩看成一组
,
计入各组之间的相互作用能
。
只要适当改变一下相互作用强度和缩小空间尺度
,
这样得到的物理图像和算得的配分函数应当基本上与原来相同
,
在相变点上则完全相同
。
换句话说
,
配分函数在一个自相似的半群变换下具有不变性
。
正如反映线性变换本质的是变换中的一些不变量
——
变换矩阵的本征值
,
自相似变换的不变量决定物理量在相变点上的奇异行为
。
1972
年威耳孙
(
K.G.Wilson
)
引用量子场论中的重正化群技术
,
在相变理论中实现了一次突破
,
终于越出了统治多年的平均场理论
。
重正化群的数学相当复杂
,
但是物理图像就像上面介绍的那样简单
。
它在统计物理学中开辟了一条新的途径
,
不是去直接计算配分函数
,
而是研究配分函数在某些变换下的不变性质
,
由之得出深刻的结论
。
八年来的进展表明
,
重正化群技术已经成为统计物理学武库中的必备兵器
。
统计物理研究具有大量运动自由度的宏观系统
。
在每个具体情形下
,
这个
“
大量
”
都是有确定上限的数
。
然而它是如此之大
,
增加或减少几个粒子也没有影响
。
因此
,
认为粒子数无限多才更好地反映了客观世界
。
这就是上面所说的取
“
热力学极限
”:
令粒子数和系统的体积趋向无穷
,
但单位体积内的粒子数
(
粒子数密度
)
仍是有限的
。
事实上统计物理中的一些根本问题
,
只有在取了热力学极限之后才变得更明朗
。
首先
,
统计物理的方法能否描述相变这类突变现象,
人们曾经有过怀疑
。
因为统计平均使一切函数变得更为光滑
,
而相变是
“
连续性的中断
”,
是尖峰和跳跃
。
自从
20
世 纪
40
年代初求得伊辛模型的数学严格解之后
,
懂得了无穷
、
尖峰等都是取热力学极限的结果
。
对于有限个粒子组成的系统
,
比热即使冒尖
,
也是有限的
。
后来实验也证实了这些看法
。
其次
,
统计
“
平均
”
是什么意义下的平均
?
对于微观运动而言
,
物理测量是一种时间平均
,
这里还取了另一个极限
:
测量时间比微观运动的特征时间大无穷多倍
,
因此微观运动的初始状态等都不应当影响测量结果
。