专栏名称: AI领域技术栈
人工智能领域技术:计算机视觉、自然语言处理、深度学习、语音识别、生物识别、大数据、图像识别、机器人过程自动化、知识图谱、人机交互、强化学习、神经网络、决策树、语音合成、虚拟代理、自主无人系统技术、自动驾驶、脑机接口、语义理解、遗传算法
目录
相关文章推荐
51好读  ›  专栏  ›  AI领域技术栈

谷歌AI摘得奥数金牌,人类智慧遭遇挑战?

AI领域技术栈  · 公众号  ·  · 2025-02-09 09:55

正文

在这个科技日新月异的时代,人工智能(AI)已经逐渐渗透到我们生活的方方面面,从智能家居到自动驾驶,从医疗诊断到金融分析,AI正以其独特的优势改变着世界。然而,当AI开始涉足数学这一人类智慧的结晶时,我们不禁要问:AI是否已经强大到足以挑战人类的智慧极限?

近日,谷歌DeepMind团队宣布其AI系统AlphaGeometry 2(简称AG2)在国际数学奥林匹克竞赛(IMO)中摘得金牌,这一消息犹如一颗重磅炸弹,瞬间引爆了科技界和数学界的热议。要知道,IMO作为全球最具权威的高数竞赛,不仅考验选手对数学概念的深刻理解,更需要极强的创造性思维。而AG2此次的表现,无疑是对人类智慧的一次巨大挑战。

AI摘金,震惊四座

去年7月,谷歌曾官宣两大AI系统AlphaProof和AlphaGeometry,其中AlphaGeometry专注于解决IMO几何题。然而,在首次参赛时,AlphaGeometry(AG1)虽然表现出色,但仍遗憾摘银。时隔6个多月,AG2卷土重来,一举夺得金牌,这一成就不仅让谷歌团队欢欣鼓舞,更让全球科技界和数学界为之震惊。
AG2此次能够摘金,得益于其全新升级的算法和模型。团队专为AG2设计了一种全新搜索算法——基于知识共享集成的搜索树(SKEST),允许多个集束搜索并行运行并相互帮助。这一算法使得AG2在解题效率和准确性上都有了质的飞跃。在2000-2024年IMO几何题上,AG2的解题率从54%飙升至84%,横扫了42道难题,这一成绩已经大幅超越历年IMO金牌得主的平均水平。

更令人惊叹的是,AG2首次破解了2009年IMO最难几何题G7(备选题)。此前,这道题只有计算性解法,如使用复数、三角计算等。而AG2却利用关键的辅助作图,给出了一个只需要“角度”和“比例推导”的优雅解法。这些辅助点是由神经符号架构中的“神经网络模型”预测得出的,这一创新性的解法让谷歌研究员当场震惊,也让全球数学界为之赞叹。

AI如何解题?揭秘AG2的奥秘

那么,AG2究竟是如何解题的呢?这背后又隐藏着怎样的奥秘呢?
首先,AG2采用了基于Gemini更强大的语言模型,该模型在更大更多样化的数据集中完成训练,显著提升了理解和推理能力。同时,谷歌还引入了更快速、更稳健的“符号引擎”,融入了简化规则集、增强双重点处理等优化。此外,模型领域语言范围也进行了扩展,涵盖了更广泛的几何概念,包括轨迹定理和线性方程。
为了进一步提升性能,AG2还实现了自动图形生成算法。这一算法使得AG2能够直接理解自然语言形式的几何问题,并将其转化为专用语言进行求解。得益于以上的改进,AG2在解题效率和准确性上取得了令人印象深刻的成绩。
在解题过程中,AG2会首先尝试通过自动图形生成算法构建几何图形。对于简单的几何问题,这一方法几乎可以瞬间生成准确的图形。对于无法直接通过几何作图构建的图形(非构造性问题),AG2则采用两阶段数值优化方法进行求解。这一方法结合了ADAM梯度下降优化和Gauss-Newton-Levenberg方法,能够精确求解非线性方程组,得到准确的图形坐标。

在证明搜索阶段,AG2会利用基于知识共享集成的搜索树(SKEST)算法进行求解。这一算法允许多个集束搜索并行运行并相互帮助,从而大大提高了搜索效率和准确性。同时,AG2还通过引入重合点处理能力和改进的DDAR2算法等优化措施,进一步提升了证明搜索的速度和效率。

AI与人类智慧的碰撞与融合







请到「今天看啥」查看全文