专栏名称: 环球物理
环球物理,以物理学习为主题,以传播物理文化为己任。专业于物理,致力于物理!以激发学习者学习物理的兴趣为目标,分享物理的智慧,学会用物理思维去思考问题,为大家展现一个有趣,丰富多彩的,神奇的物理世界!
目录
相关文章推荐
中科院物理所  ·  基于超导量子处理器的希尔伯特空间碎片化研究 ... ·  23 小时前  
中科院物理所  ·  石头中的流浪者:漂砾的自述 ·  昨天  
中科院物理所  ·  这种化石,中国只发现了四块 ·  2 天前  
中科院物理所  ·  科技热词“具身智能”到底是什么? ·  3 天前  
51好读  ›  专栏  ›  环球物理

【量子力学】不确定性原理到底在说什么?

环球物理  · 公众号  · 物理  · 2025-03-15 20:30

正文

提到量子力学, 不确定性原理 就是一个绕不开的话题。

不确定性原理非常直观地体现了 量子力学 经典力学 之间的差异,而且表述还非常简单。它既不像薛定谔方程那样需要 微积分 分析力学 的基础,也不像算符、矩阵那样需要 线性代数 的基础,基本上谁都能谈几句。但是,要想真正理解不确定性原理,就远没有看上去的那么简单了。

这种情况跟狭义相对论里的 质能方程E=mc² 很像,质能方程也是咋一看非常简单,似乎谁都能谈几句。但是,如果想真正理解质能方程,就必须深入狭义相对论语境,如果只是站在牛顿力学的角度,直接从字面意思来理解质能方程,那不可避免地就会带来各种误解(这些我在《 你也能懂的质能方程E=mc² 》里已经详细说了)。

不确定性原理 是量子力学的产物,我们也只有深入量子语境才能真正理解它,如果只是从 牛顿力学 的视角,单从字面意思去理解它,一样会产生各种稀奇古怪的 误解


01常见的误解

不确定性原理 的一个常见表述是“我们无法同时确定粒子的位置和动量”,有的地方还喜欢把“确定”替换为“测准”,说“我们无法同时测准粒子的位置和动量,你把粒子的位置测得越准,它的动量就越不准确,反之亦然”。

这就很容易让人这样理解 不确定性原理 :为什么我们无法同时测准 位置 动量 呢?因为如果这里有一个电子,你想测量它的 位置 就得用光子或者其它粒子去撞击它。你想把电子的位置测得 越准 就得使用波长越短的光(波长太长就直接绕过去了),而光的波长越短能量就越高,你用越高能量的光子去撞击电子,就会把电子撞飞得越快,这样电子的 动量 就更加 不确定 了。

于是,你觉得越想测准电子的 位置 ,就会对它的动量产生越大的干扰,进而让它的 动量 更加不确定,反之也一样。许多人认为这就是无法同时确定电子的 位置 动量 的原因,并认为这就是 不确定性原理 想说的。

这种说法很流行,很多科普文都这样介绍不确定性原理,他们告诉你: 正是因为你用光子测量电子位置的操作干扰了电子的动量,所以无法同时确定电子的位置和动量

为什么这种说法会很流行呢?

第一,它看起来好像也没啥问题,而且通俗易懂,中学生都能理解;第二,不确定性原理的发现者—— 海森堡 一开始也是这么理解的。也就是说,海森堡在 一开始 也认为是测量过程中不可避免的干扰导致了我们无法同时确定粒子的位置和动量。


我在《 什么是量子力学? 》里也讲过,许多量子力学的科普文其实都是在讲量子力学前25年的历史,既然是讲历史,那到了不确定性原理这里,自然就要讲一讲海森堡那些通俗易懂的思想实验。但是,如果你顺着历史再往后走几步,就会发现 玻尔 很快就批评了海森堡的这种思想,而海森堡自己也接受了。

也就是说,海森堡也只是在 一开始 是这样想的,他也只是在刚发现 不确定性原理 的时候觉得电子动量的不确定性是由于“测量电子位置带来的干扰”导致的, 玻尔 的批评很快就让他意识到这么想是不对的。


时至今日,随便翻开一本量子力学教材,里面大概率都会清清楚楚地告诉你: 不确定性原理并不是由于测量导致的,它是粒子的固有性质,并不依赖于任何测量

其实, 测量 是仪器和被测物体之间的一种相互作用,仪器在测量过程中肯定会对被测物体产生一定干扰,这在任何情况下都存在,并非量子力学特有的。这种 仪器对被测物体的影响 ,在物理学上有另一个名字,叫 观察者效应 (Observer effect),它跟 不确定性原理 (Uncertainty principle)有本质的区别。

经典力学 里,物体的位置和动量在 理论上 是确定的,但测量过程多多少少会对被测物体产生一定影响,所以实际的测量总会存在一定误差。

量子力学 却是在 理论上 就认为物体在一般情况下不存在确定的位置和动量,而且无论处于什么状态(本征态也好,叠加态也好),你都没法同时确定物体的位置和动量。这跟测量的精度或者测量过程产生的扰动都无关,而这,才是 不确定性原理 想告诉我们的。

也就是说,对不确定性原理那种广为流传的解释其实是 错的 。他们把不确定性原理当成了 观察者效应 ,认为是测量过程中的扰动造成了我们无法同时测准粒子的位置和动量,而没有意识到这种不确定性是 理论上 的,是粒子的 固有性质 ,跟你测不测量无关。

那么,这种理论上的不确定性是怎么来的呢?


02力学量的平均值

在《 什么是量子力学? 》里我们就讲过, 经典力学 里的力学量在任何时候都有确定值,一个物体在任何时候都有确定的位置和速度,跟你测不测量,如何测量都无关。

但到了 量子力学 ,力学量是否有确定取值却跟 系统状态 有关:如果系统处于 本征态 ,那测量这个力学量时就有确定值;如果系统处于 叠加态 ,那测量这个力学量时就 没有 确定值。因此,如果你里想讨论力学量的取值,就得先确定系统的状态,看看它是 本征态 还是 叠加态


位置 为例,如果电子处于 位置本征态 ,那测量位置时就有确定值(该本征态对应的本征值);如果电子处于 位置叠加态 ,那测量位置时就没有确定值,而是有一定概率处于各个位置本征态对应的本征值。

然后,有一点我们要特别注意: 当系统状态确定以后,虽然电子的位置在一般情况下不确定,但它 的平均值却是确 定的

比如,电子处于某个位置叠加态,测量时有70%的概率处于x=1处,有30%的概率处于x=2处,虽然我们不知道测量结果到底会是x=1还是x=2,但我们知道电子的位置平均值一定是 x=1×0.7+2×0.3=1.3。

这就是说,只要系统状态确定了(不管是本征态还是叠加态),虽然力学量的具体取值一般不确定,但它的 概率分布 却确定了(详见《 什么是量子力学? 》里的 玻恩规则 部分),任意力学量的 平均值 也就随之确定了。平均值是个非常重要的概念,从这里我们也能看到量子力学的 统计性质

提到 平均值 ,大家都非常熟悉。学校举行考试时,如果想对比两个班级的成绩,我们最常见的做法就是计算两个班级的 平均分 。计算方法也很简单,把一个班里所有人的成绩都加起来,再除以总人数就得到了这个班级的平均分。 如果 一班 的平均分比 二班 高,那我们大体上就认为一班比二班考得好。

当然,平均分很有用,但它的局限性也很大。特别是,当一个样本的数据 波动过大 时,平均值往往就很难反映真实情况了。就像大家经常调侃的,如果把我的收入跟马云、马化腾平均一下, 那大家也都是身价百亿的人了,这样的平均显然没什么意义。

同理,如果二班的 平均分 要低一些,但我们仔细一看, 却发现二班有大量同学考了95分以上,但因为某些原因也有些人只考了几分,甚至0分,这少数超低分就把班级的平均分拉了下来。而一班绝大多数人都考了70多分,既没有考得很高的,也没有考得特别低的。 这样一算 平均分,一班确实比二班高了一点,但你觉得这种情况下还仅凭平均分来判断两个班的成绩,还合适么?


为什么 平均分 在这种情况下好像并不好用了呢?原因很简单,因为 二班的 成绩波动太大了 ,接近满分和接近0分的人都有很多,而平均分会把这些波动给抹掉。 因此,如果我们想更好地描述 二班 的情况,那就得想办法描述这种 波动 ,如何描述呢?

这时候,我们就要引入两个新的量: 方差 标准差


03方差和标准差

方差 是怎样体现班级的成绩波动的呢?

思路也很简单,一班的分数大多在70到80分之间,假设它们的平均分是75分吧。 当我们说一班的成绩 波动很小 时,我们其实是在说一班的大部分成绩都在75这个平均分附近,它们相对 平均分 的波动很小。当我们 二班的成绩 波动很大 时,也是在 二班 大部分 成绩 距离它们的平均分(假设是 74分)比较远,大家相对 平均分 的波动很大。

所以,如果想计算一个班级的整体波动,那你就先把这个班级的 平均分 算出来,再把每个人相对平均分的 波动 算出来,最后把所有波动加起来再除以总人数,这样得到的结果就能大致反映一个 班级的整体波动了,这也是计算 方差 的大致思想。

比如,一班的平均分是75分,有个同学考了70分,跟平均分差5分;有个同学考了80分,跟平均分也差了5分。我们把所有人跟75这个平均分的差值都算出来,把它们加起来再除以总人数,得到的结果就能大致反映一班成绩的波动情况了。

但大家很快就会注意到:直接用 每个人的分数减去平均分的差 来度量这个波动是不行的。因为考了80分的同学减去平均分75等于5,考了70分的同学减去平均分75等于-5,你把它们直接加起来,那总的波动就是5+(-5)=0了,这肯定不对。

要解决这个问题,很多人的第一反应是给它套个 绝对值 。没错,套了绝对值以后,负数就变成了正数(|5|+|-5|=5+5=10),这样就不会再出现“正负相消”的情况了。这样处理在理论上没啥问题,但绝对值在具体计算时会比较麻烦,为了方便计算,我们采用了另一种方式: 给它套个平方

大家知道, 负数 的平方也是 正数 ,这样它也能达到绝对值的效果,但计算起来会更方便。

比如,对于考了70分的同学,我们用70减去平均分75,再套个平方(70-75)²=25来表示这个波动;对于考了80分的同学,我们就用(80-75)²=25来表示这个波动,其他人以此类推。把所有人相对平均分的差的 平方 都加起来,再除以总人数就得到了衡量班级 整体波动 水平的 方差


有了方差,我们就能看清各个班级的波动情况了,也能清楚地看到二班的成绩波动确实比一班大。

一班的平均分是75分,大量考了70分的同学产生的波动只有(70-75)²=25;假设二班的平均分是74分,那考了100分的同学立马就会产生(100-74)²=676的波动,考了0分的同学更是以一己之力就能贡献(0-74)²=5476的波动值。闭着眼睛都知道,二班的方差肯定会远远大于一班,这也反映了二班成绩的波动远远大于一班。

所以,通过 方差 ,我们确实能够判断样本的波动情况。不过,从上面的例子大家也能看到,方差虽然好用,但它的数值还是有点偏大(考了0分的同学对应的值竟然高达5476,这让我们很难直观地作判断)。为了方便判断,我们对方差再开个根号(方差是9,标准差就为3),这样就得到了 标准差 (一般用 σ 来表示),后面我们使用的也都是 标准差σ

平均值 方差 标准差 都是 概率统计 里最基础的东西,大家在中学数学里也学过了,这里我就不再细说了。在这里,我们只要知道方差和标准差可以衡量一个样本的波动情况,方差、标准差大,就说明它们偏离平均水平越厉害就行了。


04不确定性原理

好,再回到主题。我们刚刚不是在讲 不确定性原理 的么,为什么这里突然讲起了方差和标准差?

那是因为,大家经常看到的不确定性原理的表达式 ΔxΔp≥ℏ/2 (ℏ=h/2π),这里的 Δx Δp 指的就是 标准差 ,而不是大家先入为主地以为的 测量误差


什么意思?

意思就是,你经常看到的不确定性原理 ΔxΔp≥ℏ/2 ,它说的是位置x和动量p的 标准差 的乘积最小只能为ℏ/2,它说的是 统计意义 上的标准差的乘积不能无限小,而不是说测量时的干扰误差。

很多人一看到Δx,潜意识里就会认为这是一个微小的位置变化。到了不确定性原理 ΔxΔp≥ℏ/2 这里,就很容易把Δx当成测量位置时由于干扰带来的误差,这样就很容易陷入一开始说的那种对不确定性原理的 错误理解 中去,让我们误以为粒子的不确定性是由测量的扰动引起的。

如果这里不是用的 Δx Δp ,而是 σx σp ,那 不确定性原理 是不是就没那么容易引起误解了呢?

在很多教材里, 位置 - 动量 不确定关系 确实写作 σxσp≥ℏ/2 (ℏ=h/2π),这里的 σx σp 并不是测量位置、动量时的干扰误差,而是从 统计意义 上来说的位置和动量的 标准差


那问题就来了: 一个粒子的位置和动量,怎么会有统计意义上的标准差呢

经典力学 里,这个概念当然是毫无意义的。经典力学的粒子在任何时候都有确定的位置和动量,它们没有任何波动,谈论单个粒子的位置和动量在统计意义上的平均值和标准差也显得相当搞笑。

但到了 量子力学 ,情况就完全不一样了。在量子力学里,只有当系统处于 位置 本征态 时,粒子的位置才是确定的;当系统处于 位置 叠加态 时,粒子的位置就是不确定的。测量时有一定的概率处于这个位置,有一定的概率处于那个位置,我们还能算出具体的概率值。

当粒子有一定概率在这,也有一定概率在那时,我们不就可以计算粒子的位置 平均值 了么(假设有许多跟它一模一样的粒子,我们一个个去测量,再统计它们的平均值)?有了平均值,每个可能的位置相对平均值的波动也能算出来,于是,我们就能计算出粒子的位置 标准差σx ,动量标准差 σp 也一样。

这样一来,我们就能从 统计意义 上谈单个粒子的各种力学量的平均值、方差和标准差了,因为粒子的力学量在一般状态下并没有确定值。


再回到前面的例子,我们假设电子处于某个位置叠加态,测量时有70%的概率处于x=1处,有30%的概率处于x=2处。虽然我们不知道测量时电子到底会在x=1还是x=2处,但我们还知道它的平均值一定是 x=1×0.7+2×0.3=1.3。

而且,我们知道这个 平均值 跟你测不测量 无关 ,只要系统状态确定了,概率分布确定了(70%的概率x=1,30%的概率x=2),我们就能在 测量之前 把平均值x=1.3算出来。 算出了位置 平均值,我们一样可以仿照班级考试的例子,算出电子在 这个状态 下位置的 标准差 σx ,并用它来衡量电子位置的波动情况。

因为这个 σx 也是在 测量之前 算出来的,所以我们不需要等测量结束,也不需要知道测量过程中到底有多大扰动就能算出电子的位置标准差σx, 它跟你测不测量完全无关

假如粒子处在 状态一 的时候,它有50%的概率处于x=4.9处,有50%的概率处于x=5.1处,此时的平均值为x=5; 子处于 状态二 的时候,它有50%的概率处于x=1处,有50%的概率处于x=9处,此时的平均值 还是 x=5。这两个状态下粒子的位置平均值都一样,但我们闭着眼睛都知道状态二的波动更大,所以它的 位置标准差 σx 也更大。类似的 ,我们也能算出 子在各个状态下的 动量标准差 σp

也就是说,只要系统状态确定了,不管你有没有测量,我们都能算出粒子的位置和动量的标准差 σx σp 。那么,这个 σx和 σp有没有什么关系呢?

经过一番 数学推导 ,我们发现粒子在 不同状态 下虽然会有不同的位置标准差σx和动量标准差σp,但不论系统状态如何变化,也不论 σx σp 跟着如何变化,它们的乘积 σxσp 都不可能小于 ℏ/2 。这就是大家最为熟知的位置和动量的不确定关系 σxσp≥ℏ/2

这个推导过程我们后面再说,在这里,我们起码能清晰地看到: 粒子的位置平均值是在测量之前就能算出来的,位置和动量的标准差σx、σp也是在测量之前就能算出来的,所以,经过数学推导得到的位置-动量不确定关 系σxσp≥ℏ/2也是在测 量之前就能得到的

如果我们在测量之前就能得到这个关系式 σxσp≥ℏ/2 ,那你还能说 不确定性原理 是由于测量的扰动引起的么?你都还没有开始测量, 那还谈什么测量带来的干扰误差?

这样的话,大家能理解为什么我们之前一直说“ 不确定性原理并不是由于测量造成的,它是粒子的固有性质,跟你测不测量无关 ”了么?


05一般的不确定关系

大的基调定下来之后, 我们再来看看具体的推导过程。

在这里,我们先不盯着位置和动量,而是 先考虑 更一般 的情况。 假设有两个 任意 的力学量A和B,系统状态确定以后,概率分布就确定了,我们就能算出力学量A、B的平均值,进而算出这两个力学量的标准差 σ A和 σ B。

那么,不同力学量的标准差之间又有什么关系呢?

利用 施瓦茨不等式 ,经过一番纯数学推导,我们就得到了这样一个关系式:


具体的推导过程比较无趣,我这里就不写了,感兴趣的可以自己去翻一翻量子力学教材。但大家要清楚,我们这里 没有引入任何额外的假设 ,我们只是用了标准差的基本定义,然后利用施瓦茨不等式就得到了上面的不等式。所以,这是一个 普适 的关系式,是 最一般 的不确定关系。

它告诉我们: 任意两个力学量的标准差的乘积 σ A σ B必须大于等于这两个力学量的对易式[A,B]的平均值(<>代表求平均值)的绝对值的一半

说起来有点拗口,但平均值和绝对值大家都很熟悉,这里真正起决定作用的是A、B的 对易式[A,B] ,只要对易式确定了,这个不等式就确定了。而算符A、B的 对易式 是这样定义的: [A,B]=AB-BA ,也就是把两个算符的作用顺序交换一下,再相减。

很多人看到这个 对易式 之后心里就在犯嘀咕: AB-BA不应该恒等于0么 ?就像3×5-5×3=0一样,任何两个 交换相乘的顺序,得到的乘积应该都一样,它们相减之后的结果肯定就是0啊。

如果 [A,B] 恒等于0,那你定义这个又有什么意义?


没错,我们从小就学了 乘法的交换律 :如果A、B都是 ,两个数交换顺序,最后的乘积肯定不变。所以AB一定等于BA,[A,B]=AB-BA就一定恒等于0。

但是,我们这里的A、B并不是 啊,它们是描述力学量的 算符 。我们确实从小就学了数的乘法交换律,但你有学过算符的乘法交换律么?

没有吧!也不可能学过,因为 算符之间压根就没有普适的乘法交换律 。有的算符之间可以交换乘法顺序,有的则不能,这跟数的情况完全不一样。

那么,算符的乘法是什么意思呢?两个算符之间可以交换乘法顺序又是什么意思?


06对易式

在《 什么是量子力学? 》里我们讲过了,量子力学里用 矢量 描述系统状态,用 算符 描述力学量。算符可以作用在一个矢量上,把一个矢量变成另一个矢量。比如,我们对一个矢量进行平移、旋转、投影操作,就会对应有平移算符、旋转算符、投影算符。我们把平移算符作用在一个矢量上,就会把一个矢量平移到另一个地方,其它算符也类似。

在A、B的对易式 [A,B]=AB-BA 里,A、B都是算符,而系统状态ψ是矢量,所以我们就可以把算符B作用在态矢量ψ上,这样就得到了新的矢量 。而Bψ也是一个矢量,那我们又可以把算符A作用在矢量Bψ上,这样得到的新矢量就是 ABψ

也就是说,算符是 从右往左 依次作用在矢量上的, ABψ就代表态矢量ψ先被算符B作用了一次,然后又被算符A作用了一次 。如果A代表平移算符,B代表旋转算符,那ABψ就代表先把态矢量ψ旋转(B)了一下,再把这个矢量平移(A)了一下;而BAψ就代表先把态矢量ψ平移(A)了一下,再把这个矢量旋转(B)了一下。

这样一来,算符A、B的对易式 [A,B]=AB-BA 就很好理解了:因为A、B都是算符,AB和BA表示两个算符的连续作用,那就还是一个算符,所以它们相减的结果AB-BA仍然是一个算符。

既然是算符,那我们自然就可以把 算符[A,B] 作用在矢量ψ上,这就相当于一方面先用算符B后用算符A作用在矢量ψ上(得到了ABψ),另一方面先用算符A后用算符B作用在矢量ψ上(得到了BAψ),最后再把这两种方式得到的矢量相减 ABψ-BAψ

如果先A后B作用在矢量ψ上,与先B后A作用在矢量ψ得到的结果是完全一样的,也就是说 [A,B]ψ= ABψ-BAψ =0 ,那就说明算符A、B之间的乘法是 可以交换 顺序的,这时候我们说算符A和算符B是 对易的 。比如,同一平面内两个 旋转算符 就是对易的,你想想,把一个矢量先旋转一定角度α,再旋转一定的角度β,跟你先把矢量旋转一定的角度β,再旋转一定角度α得到的结果是不是一样的?

当然,并不是所有的 ABψ-BAψ 都等于0。当 [A,B]≠ 0 的时候,那就说明算符A、B之间的乘法顺序 不可交换 ,我们就说算符A和算符B 不对易 。比如, 平移算符 空间反射算符 就不对易,你想想,把一个矢量先向右平移一段,再以原点为中心翻转一下,跟你先把矢量翻转一下,再向右平移的结果一样么?

再比如,同样一本书,你先围绕x轴旋转,再围绕y轴旋转,得到的结果跟你先围绕y轴旋转,再围绕x轴旋转的结果还一样么?


这些例子都非 常简单,大家仔细琢磨一下,就会发现两个算符之间对易或者不对易都是有可 的。


07对易的力学量

理解了 算符乘法 数乘 之间的不一样之后,我们再回头看看那个最一般的不确定关系:


如果力学量A和力学量B对应的算符是 对易 的,也就是说[A,B]=0,那不等式的右边就变成了0。于是,这个不等式就变成了“ 力学量A和B的标准差的乘积σA σ B≥0 ”。

有人说这不是废话么?标准差 σ 肯定是大于等于0的啊!我们在求 方差 的时候就是先套了个平方,确保所有的数都非负,标准差不过是对方差再开个根号,那结果肯定还是非负啊。 所以,当力学量A、B对应的算符 对易 时, 这个式子相当于在说“它们标准差的乘积大于等于0”,这是一句废话。

话不能这么说,当力学量A、B对易,也就是[A,B]=0的时候,最一般的不确定关系给出的限制是 σA σB≥0 。虽然标准差确实都大于等于0,但如果不确定关系给出的限制是 σ≥0,这起码说明 σ 可以取0。因为如果限制是 σ≥3,那 σ就不能取0、1、2了。

所以,如果力学量A、B 对易 ,最一般的不确定关系给出了限制 σA σB≥0 ,这起码说明: 它允许力学量A、B的标准差同时为0,也就是允许σA=σB=0

那么,允许力学量A、B 的标准差 同时 为0,这又意味着什么呢?

前面我们讲过了, 标准差 是反映样本的波动情况的。在量子力学里,如果 系统状态ψ确定了,概率分布也就随之确定了,我们就可以算出这个状态下任意力学量的平均值,进而求出它们的 标准差σ 。我们还知道标准差是 非负 的,这就意味着 力学量可以取的值只要有一个不等于平均值,它就会让力学量的标准差 σ>0

比如,还是假设粒子有70%的概率位于x=1处,有30%的概率位于x=2处,在这个状态里, 子的位置平均值 x=1×0.7+2×0.3=1.3。又因为 子可以取的两个值x=1和x=2都不等于平均值1.3,那它们在计算方差时肯定会产生大于零的(1-1.3)²=0.09和(2-1.3)²=0.49,最终的方差和标准差都大于0。

如果你想让这个 子的位置标准差 σx= 0 ,那就必须让 子所有可能取的位置都等于它的平均值 。因为只有这样,每个位置减去平均值的结果才是0,一堆0加起来还是0,于是标准差才能为0。






请到「今天看啥」查看全文