专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
目录
相关文章推荐
黄建同学  ·  终于还是来了……Pika 推出的 ... ·  13 小时前  
爱可可-爱生活  ·  【[85星]VideoRAG:超长视频理解与 ... ·  14 小时前  
黄建同学  ·  不得了了……Replit ... ·  2 天前  
AIbase基地  ·  AI日报:​DeepSeek上线国家超算互联 ... ·  2 天前  
AIbase基地  ·  AI日报:​DeepSeek上线国家超算互联 ... ·  2 天前  
爱可可-爱生活  ·  【Claude和o3 ... ·  3 天前  
51好读  ›  专栏  ›  人工智能学家

《中国科学基金》 | 鄂维南院士:2024年诺贝尔物理学奖评述

人工智能学家  · 公众号  · AI  · 2024-12-03 16:59

正文

来源: 中国科学基金

2024年诺贝尔物理学奖评述

鄂维南*


北京大学 北京科学智能研究院

鄂维南 北京科学智能研究院理事长,北京大学国际机器学习研究中心主任。中国科学院院士,美国数学学会、美国工业与应用数学学会、英国物理学会、中国工业与应用数学学会、中国运筹学会、中国计算机学会Fellow。 研究领域为机器学习、计算数学、应用数学。2022 年国际数学家大会1小时报告人。2022年国际机器学习大会特邀报告人。2003年获国际工业与应用数学协会Collatz奖。2020年获国际高性能计算最高奖ACM Gordon Bell奖。2023年获国际工业与应用数学协会Maxwell奖。

摘  要


深度学习方法起源于20世纪80年代。其根源一方面来自于霍普菲尔德在生物物理学方面的工作,另一方面来自于辛顿的玻尔兹曼机、多层感知机和反向传播算法等一系列工作。今年的诺贝尓物理学奖肯定了人工神经网络和深度学习作为物理学的研究对象,给物理学提供了一个迫切需要的新的增长点。这个奖项对物理学和人工智能的发展,都会带来帮助。

关键词: 人工神经网络、记忆、吸引子、深度学习

2024年诺贝尔物理学奖授予了约翰·霍普菲尔德(John J. Hopfield)和杰弗里·辛顿(Geoffrey E. Hinton), 以表彰他们用开创性方法和概念在塑造人工神经网络领域方面发挥的重要作用。这一奖项引发了广泛关注和讨论,尤其是辛顿的获奖。从传统的观点来看,辛顿本人的研究生涯跟物理学几乎没有交集。那么他为什么能够获得诺贝尔物理学奖?在许多人眼里,诺贝尔物理学奖是诺贝尔奖中含金量最高也是要求最苛刻的一个奖项。物理学家或者物理学的工作在其它领域获奖的例子并不少见。例如密度泛函理论,虽然是物理学家的工作,也发表在物理学期刊上,但是获得了诺贝尔化学奖。而其他领域的科学家或其他领域的工作获得诺贝尔物理学奖的例子却很难找到。如何看待这个诺贝尔物理学奖,尤其是辛顿的获奖?本文提供一个个人视角。
首先,这个诺贝尔物理学奖究竟奖励的是什么工作。在公开的获奖介绍里提到,此奖项是表彰基于人工神经网络实现机器学习的基础性发现和发明。霍普菲尔德首先提出从一个充分大的、简单重复的动力系统中可以涌现出计算能力,比方说记忆[1]。
这些记忆以动力系统吸引子的形式出现。那些简单重复的单元可以被视为神经元。这个机制是鲁棒的,它对神经元模型的细节并不敏感,所以我们既可以把这个动力系统看成是一个脑神经网络的模型,也可以把它看成是一个集成电路或者人工神经网络的模型。
从一个充分大的、简单单元的叠加构建起来的动力系统中可以涌现出宏观吸引子,这个现象本身并不是霍普菲尔德首先发现的。流体力学中的涡就可以看成是这类现象。但我们不能把涡看成是记忆。一个有用的记忆模型必须能够记住任何我们希望它记住的状态。也就是说,任给几个状态,我们必须能够选取上述动力系统中的超参数,使得这些状态是这个动力系统的吸引子。霍普菲尔德的神经网络模型具备这个性质。
神经网络的概念起源于1943 年McCulloch 和 Pitts 的文章[2]。Rosenblatt的感知机对人工智能的发展也产生了巨大影响[3]。但这些工作关心的都是比较简单直接的计算功能。霍普菲尔德的工作让我们首先看到通过涌现现象,大神经网络可能带来的新的能力。这是一个新的视角,也是一项典型的生物物理学工作。它把复杂动力系统的想法应用于神经科学,对后来神经科学的发展产生了深远影响。随便提一下,多年之后,涌现现象成了深度学习大模型的一个重要标志。
辛顿则是深度学习的孕育者。他缔造了深度学习,也承受了过程中的痛苦。辛顿受霍普菲尔德工作的影响,但关注的是人工智能。他提出的玻尔兹曼机、多层感知机和反向传播算法,为现代深度学习奠定了基础[4, 5]。无论是玻尔兹曼机,还是反向传播算法,离诺贝尔物理学奖的要求还是有距离的。尽管玻尔兹曼机中创造性地引入了概率模型,但在众多的神经网络模型中,很难说它起到了很特别的作用。反向传播算法是训练深度神经网络的基本工具,但类似的想法已经更早出现在控制论方法中[6]。辛顿的主要贡献在于他通过一系列的工作,如多层感知机、反向传播算法以及AlexNet, 引入了深度学习这个工具并让我们看到了它的强大威力[7]。
这个过程并不很顺利,包括辛顿的博士指导导师在内的很多人对他选择的方向都不看好,但他最终通过AlexNet 等工作说服了学术界。这背后的动力,在于他对神经网络的深刻的洞察力。辛顿坚定不移地认为,神经网络有着巨大的潜在能力。如果有足够高质量的数据和足够大的模型,深度学习的威力就会显现出来。人工智能现在的进步,根本上还是来源于辛顿多年来的坚持和推动。
对物理学来说,这个诺贝尔奖至少有两方面的意义。第一,它强化了物理学对人工智能发展的贡献。通过霍普菲尔德到辛顿这样一条线索,让人们意识到物理学在人工神经网络乃至人工智能发展中的重要作用。这是一个极其高明的宣传手段。更重要的是,它为物理学的发展打开了一个巨大的空间。尽管神经网络本质上是一个数学工具,但是物理学的方法很可能可以提供一些新的视角和新的手段。尤其重要的是,大模型是一个复杂系统。许多复杂系统研究中观察到的现象和发展起来的方法,都可能对大模型的研究有帮助。如标度律和涌现现象,都已经在大模型中出现。把它作为物理学新的研究对象,无论是对物理学的发展,还是对人工智能的发展,都会带来帮助。它给物理学提供了一个迫切需要的新的增长点。

如果我们把深度学习看着是一个20世纪80年代诞生的婴儿,那么霍普菲尔德就像是它的父亲,辛顿就像是它的母亲。这就是这个诺贝尔物理学奖的意义。

参考文献(略)

阅读最新前沿科技研究报告, 欢迎 访问欧米伽研究所的“未来知识库”


未来知识库 是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。 目前拥有超过8000 篇重要资料。 每周更新不少于100篇世界范围最新研究 资料 欢迎扫描二维码或点击本文左下角“阅读原文”进入。



截止到11月25日 ”未来知识库”精选的100部前沿科技趋势报告


  1. Air Street Capital《2024 年人工智能现状报告》

  2. 未来今日研究所:2024 技术趋势报告 - 广义计算篇

  3. 科睿唯安中国科学院 2024 研究前沿热度指数报告

  4. 文本到图像合成:十年回顾

  5. 《以人为中心的大型语言模型(LLM)研究综述》

  6. 经合组织 2024 年数字经济展望报告加强连通性创新与信任第二版

  7. 波士顿咨询 2024 全球经济体 AI 成熟度矩阵报告

  8. 理解世界还是预测未来?世界模型的综合综述

  9. Google Cloud CSA2024 AI 与安全状况调研报告

  10. 英国制造商组织 MakeUK2024 英国工业战略愿景报告从概念到实施

  11. 花旗银行 CitiGPS2024 自然环境可持续发展新前沿研究报告

  12. 国际原子能机构 2024 聚变关键要素报告 - 聚变能发展的共同愿景

  13. 国际可再生能源署 IRENA2024 年全球气候行动报告

  14. Cell: 物理学和化学 、人工智能知识领域的融合

  15. 智次方 2025 中国 5G 产业全景图谱报告

  16. 未来今日研究所:2024 技术趋势报告 - 移动性,机器人与无人机篇

  17. Deepmind:AI 加速科学创新发现的黄金时代报告

  18. PitchBookNVCA2024 年第三季度全球风险投资监测报告

  19. 德科 2024 年未来全球劳动力报告

  20. 高工咨询 2024 年协作机器人产业发展蓝皮书

  21. 国际能源署 IEA2024 年全球能源效率报告

  22. 基因慧基因行业蓝皮书 2024 - 2025

  23. 普华永道 PwC2024 全球经济犯罪调查英国报告 - 智对风险直面挑战

  24. 中国互联网协会 2024 面向未来网络的数字孪生城市场景应用白皮书

  25. 中移智库 2024 先进感知新技术及新应用白皮书

  26. 智次方研究院 2025 中国 AIoT 产业全景图谱报告

  27. 未来今日研究所:2024 技术趋势报告 - 人工智能篇

  28. 国际电联:迈向衡量数字经济的通用框架的路线图

  29. 联合国粮食与农业组织:2024 年世界粮食安全和营养状况

  30. 大语言模型综述

  31. 李飞飞等,AI 智能体:探索多模式交互的前景综述

  32. 哈尔滨工业大学 - ChatGPT 调研报告

  33. 2024《美国核部署战略报告》最新文件

  34. 清华大学:AIGC 发展研究 3.0 发布版 b 版

  35. OpenAI:2024 年 OpenAI o1 大模型技术报告

  36. Verizon2024 年世界支付安全报告

  37. 皇家学会哲学学报 从复杂系统角度评估人工智能风险

  38. 复旦大学 大模型 AI 代理的兴起和潜力:综述

  39. 经合组织 OECD2024 年气候行动监测报告

  40. Wevolver2024 年边缘人工智能现状报告 - 探索各行业边缘 AI 应用动态

  41. 2024 全球人形机器人产品数据库报告 - 人形机器人洞察研究 BTIResearch

  42. 《全球金融稳定报告》 把舵定航 不确定性、人工智能与金融稳定

  43. 瑞士洛桑联邦理工学院 《人工智能中的 - 创造力:进展与挑战》

  44. 《你所需要知道的理 - 论:人工智能、人类认知与决策》牛津大学最新 53 页报告

  45. 世界经济论坛 新兴技术时代的网络弹性导航:应对复杂挑战的协作解决方案 2024

  46. ADL 理特咨询 2024 汽车出行未来展望报告

  47. 2024 中国硬科技创新发展白皮书 - 开辟未来产业新赛道

  48. 科学时代的大语言模型中的人工智能

  49. Gartner2025 年重要战略技术趋势报告

  50. CBInsights2024 年第三季度全球人工智能投融资状况报告

  51. TrendHunter2025 年全球趋势报告 - 全行业顶级创新和变革趋势前瞻

  52. 天津大学 2024 大模型轻量化技术研究报告

  53. 欧洲海洋局 2024 导航未来报告将海洋置于更广泛的地球系统中第六版

  54. 美国安全与新兴技术中心 2024 AI 生成代码的网络安全风险研究报告

  55. 国际原子能机构 2024 年世界聚变展望报告

  56. 复旦大学 2024 大语言模型的能力边界与发展思考报告

  57. 安盛 AXA2024 年气候与生物多样性报告气候过渡计划路线图

  58. YouGov2024 美国公众对人工智能 AI 的态度调研报告

  59. 麦肯锡中国报告:《中国与世界》完整版

  60. 麦肯锡全球研究所 2024 下一代竞技场报告 - 重塑全球经济的 18 个新兴行业领域

  61. Project Sid,一个旨在模拟多智能体交互以研究 AI 文明的项目

  62. 德国研究与创新专家委员会 德国研究创新与科技成果报告







请到「今天看啥」查看全文