本文报道了关于数学界一项重大突破的新闻,UCLA和MIT的研究者证伪了概率论中众所周知的假设「上下铺猜想」。这个猜想自1985年提出以来,一直作为多年未解的难题存在。研究者们在使用AI工具多次折戟后,采用了全新的方法,发现了其反例,最终推翻了这一猜想。文章还介绍了研究团队的成员背景以及研究过程。
UCLA和MIT的研究者通过采用全新方法,发现了上下铺猜想的反例,成功证伪了这个猜想。这一成果在数学界引起了广泛关注,因为上下铺猜想是概率论中一个重要的假设,其证伪将对相关领域产生深远影响。
本文介绍了研究团队的成员背景以及研究过程。研究团队包括加州大学洛杉矶分校的数学系教授Igor Pak、博士生Nikita Gladkov以及麻省理工学院数学系博士三年级学生Aleksandr Zimin。他们在研究过程中遇到了很多困难,包括使用神经网络方法的失败、构建反例的复杂性等。最终,他们通过结合理论论证和构建大型图的方法,成功找到了证明上下铺猜想错误的证据。
数学界对这项研究的反应不一,一些人欢迎这一突破性的成果,认为这将有助于推动相关领域的发展。而另一些人则担心这种概率性证明可能会削弱对问题本质的理解和直觉。此外,随着AI等技术持续渗透和改变数学领域,这个问题只会愈发紧迫。一些专家建议,应该为这类研究创建专门的学术期刊,以免其价值被数学界忽视。
【新智元导读】
39年来一个看似理所当然的数学理论,刚刚被数学家证伪!UCLA和MIT的研究者证实:概率论中众所周知的假设「上下铺猜想」是错的。有趣的是,他们用AI已经证明到了99.99%的程度,但最终,靠的还是理论论证。
又一个看似坚固无比的数学理论,被证伪了!
最近,UCLA和MIT的研究者证伪了概率论中众所周知的假设——「上下铺猜想」。
上下铺猜想(Bunkbed Conjecture)也称为双层床猜想,是渗透理论中的一个陈述,该领域处理的是在图的边随机删除后存在的路径和簇。
猜想指出,在生成的随机子图中,上(下)铺的顶点连接到上(下)铺的某个顶点的概率,大于或等于它连接到下(上)铺顶点——即对应同构顶点的概率。
用白话说就是,在同一层的两个顶点之间的连接概率不可能小于连接不同层顶点之间的概率。这看起来确实再明显不过了!
1985年,数学家Pieter Kasteleyn首次提出了上下铺猜想。
然而,这个问题的猜想却让几代概率论学家都束手无策,一直作为一个多年未解的难题存在至今。原因在于……它是错的!
39年后,来自UCLA和MIT的三位研究者,在使用AI工具却多次折戟后,采用了全新的方法,发现了它的反例。
论文地址:https://arxiv.org/abs/2410.02545
由此,在学界似乎坚固无比的「上下铺猜想」自然就被推翻了。
此前,大量的工作都被用在证明这个猜想的正确性上,然而这几位研究者却反其道而行之,经历多次失败后,终于找到了反例。
许多数学家做研究的过程,是由直觉驱动的,比如可以感知数学真理的印度数学天才拉马努金。
这种直觉,来自对某些事情应该为真的深刻认知。但有时,直觉也会误导数学家,因为早期证据无法代表全貌,一个看似显而易见的陈述,也会有某些隐藏的细微之处。
20世纪80年代中期,一位名叫Pieter Kasteleyn的荷兰物理学家,想要在数学上证明一个关于液体如何在多孔固体中流动的推断。
由此,他提出了上下铺猜想。
要理解这个猜想,要先从一个图开始:这个图是由线或边连接的点或顶点的集合。
现在,让我们做一个这个图的精确副本,然后将它直接放置在原始图的上方。
在它们之间画一些垂直的柱子——这些是连接底部图上一些顶点与顶部图上对应顶点的额外边。
最终,我们会得到一个类似于上下铺的结构。
接下来,考虑底部图中的一条边。
抛一次硬币,如果是正面,就擦掉这条边;如果是反面,就保留这条边。对两个图中的每条边重复这一过程。
最终,顶部和底部的图会看起来不同,但它们仍然会通过垂直的「柱子」相连。
最后,在底部图中选择两个顶点。
你能沿着图的边从一个顶点走到另一个顶点吗,还是这两个顶点现在已经不连通了?
对于任何一个图,你都可以计算出存在路径的概率。
现在,再来看这两个相同的顶点,不过把其中一个替换为它在顶部图中正上方的顶点。有没有一条路径,可以让你从底部图中的起点顶点到顶部图中的终点顶点?
此处再复习一下:上下铺猜想认为,在下铺找到路径,其概率总是大于或等于跳到上铺找到路径的概率。
无论从哪个图开始,在上下铺之间画多少垂直柱,选择哪些起始和终点顶点,都不影响这一事实。
从直觉上看,这是个理所当然的事。
「我们的大脑告诉我们的任何信息,都表明这个猜想应该是正确的」,普林斯顿大学的图论学家Maria Chudnovsky这样说
也因此,几十年来,数学家们一直认为这是真的。
他们的直觉告诉他们,在一个铺位上移动应该比在两个铺位之间移动更容易——从下铺到上铺所需的额外垂直跳跃,应该会显著减少可用路径的数量。
而且,数学家们也希望它是真的。因为这些图可以被视为流体如何在多孔材料中移动或渗透的简化模型,就像水在海绵中移动一样。
如果上下铺猜想成立,物理学中被广泛相信的流体通过固体的可能性也就成立,渗流物理学的相关问题也能被解决。
然而数学家们在39年间尝试了无数次,却无人能够证明。
原因就在于——上下铺猜想是错的!
并不是所有数学家都相信上下铺猜想的真实性,加州大学洛杉矶分校的数学家Igor Pak就是其中一个。
他的研究生Nikita Gladkov表示,对于学界一直集中精力试图证明这个猜想,自己的导师毫不掩饰自己的批评。「如果它是错的呢?」
Igor Pak的怀疑还有一个理由:这个说法过于宽泛了。它真的适用于每个可想象的图吗?
「有些猜想是由实际动机驱动的,而其他猜想则是数学家的一厢情愿。」上下铺猜想看起来更像是后者。
Igor Pak的博客
Igor Pak意识到,是时候上一些暴力了!他让学生Gladkov使用计算机,对能找到的每一个图进行「暴力搜索」。
这就涉及到一些复杂的编程,因此Gladkov找来了大学室友、现MIT研究生Aleksandr Zimin,也是自己睡在下铺的兄弟。
三人开始手动检查少于九个顶点的每一个可能的图。在这些图中,上下铺猜想是成立的。
但对于更大的图,可能的情况数量就一下子激增,他们无法再通过穷举法,穷尽所有可能的边缘删除方式或路径形成方式了。
使用机器学习方法,他们训练了一个神经网络,用于生成可能更偏好向上跳跃的迂回路径图。
在众多示例中他们发现,下铺路径会比上铺替代路径概率稍高一点。但模型始终没有发现任何反例——也就是不同层路径概率更高的情况。
还有一个问题,就是神经网络生成的每个图过于庞大,以至于数学家们根本不可能调查抛硬币步骤的每一个结果。
他们意识到,自己可以对神经网络给出的任何反例有超过99.99%的信心,却始终无法达到100%。
三人陷入怀疑:这种方法是否还值得?毕竟,只能达到99%而非百分百的证明,根本不足以说服数学圈,也不会被哪个著名期刊认为是足够严谨的证明。
「博士生需要的是现实中的工作,而不是理论上的工作,」Pak在博客上写道。Gladkov和Zimin很快就要找工作了,最终,三人停止了这项工作。
虽然他们放弃了计算方法,却并未停止思考这个问题。接下来的几个月,他们拼命想做出一个不需要计算机的理论论证,却缺少所需的所有要素。
6月,剑桥大学的Lawrence Hollom在另一种语境下,证伪了上下铺问题的一个版本。
这个猜想的表述并非针对图,而是研究称为超图(hypergraph)的数学对象。在超图中,边的定义不再局限于连接一对顶点,而是可以连接任意数量的顶点。
Hollom找到了这个版本猜想的一个反例。他创建了一个小型超图,每条边都连接三个顶点:
Gladkov发现这篇论文后意识到,这正是他们三人所需要的!
他从晚上一直读到凌晨3点,并在睡觉前给Zimin发了短信。第二天,两个人便通了电话。就能否将Hollom的反例转化为一个能否推翻原始上下铺猜想的普通图,展开了讨论。
去年年初,他们在一起参加音乐会之前讨论过这个问题。「红辣椒乐队在唱歌,而我在思考这个问题,」Gladkov说道。
后来,他们开发出了可以在特定情况下将超图转化为图的技术。
如今,这些技术刚好可以用来改造Hollom的超图。
Gladkov、Pak和Zimin用庞大的点集和普通边组成的集群,替换了超图中的每个三顶点边。
最终,他们得到了一个巨大的图,由7,222个顶点和14,422条边连接而成。
他们放弃了AI的方法后,利用构建的理论来重新证明。
最终,他们在图中发现,对于位于下路径的点,找到上路径的概率比找到下路径高出1/10^6,500个百分点——虽然这个数值极小,但并不为0。
果然,数学家们在任何时刻都不能想当然地接受任何事。普林斯顿数学家Noga Alon表示:「我们必须保持怀疑,即便是那些直觉上看起来极有可能为真的事情。」
不过,Gladkov、Pak和Zimin只是找到了许多符合该猜想的小图,但这些例子并且最终反映出——当顶点和边的数量足够多时,数学家可以构造出更为复杂且反直觉的图。
正如Hollom所言,「我们真的像我们自认为的那样,理解所有东西吗?」