专栏名称: 人工智能学家

致力成为权威的人工智能科技媒体和前沿科技研究机构

MIT对大模型数理原理的强有力证明

人工智能学家 · 公众号 · AI · 2024-11-14 17:11

正文

来源：清熙

笔者去年整理的 大模型数理原理 ，迎来了最强有力的实践证明！

原理回顾

笔者在“GPT4技术原理”系列文章梳理出来大模型数理认知框架如下图：

海量的文本或者多模态语料组成了大模型需要认知的外部世界的基本信息；嵌入构建高维概率化的语言空间，用来建模语言文字图像以及音视频，并对连续变量做离散化；

预训练以 重整化群流 的方式进行，在不同尺度上提炼语料数据中的信息概率分布；重整化群流的每一步流动（自回归预测逼近训练语料概率分布），都沿着最优输运的 成本最低方向 进行；

重整化群在不动点附近因新语料带来微扰而发生 对称性破缺 ，滑入不同的相空间；不同的相空间，对应某种意义上的范畴，可形象化为信息的结晶；这是大模型从语料中学到的 内部世界模型 ；

在外部感官输入下（被提示置于某种上下文），大模型内部将限定在相应的高维语言概率空间的子空间内推理；推理是在 子空间中采样 ，类比时 跨范畴采样 ；

采样不断进行，基于内部概率化了的世界模型（预训练获得的先验），针对感官输入（提示），做 变分推断 ，最小化自由能，获取最佳采样分布q* ，作为对导致感官输入的外部后验的预测。

可总结为：1、重整化从海量语料中提取出范畴，2、持续重整化驱动范畴解构重组结晶，3、生成过程于范畴中采样做变分推理。

笔者在 降低大模型幻觉的必由之路 文中针对重整化、范畴与transformer之间的关系做了详细的阐述：

重整化 本质是尺度从小到大粗粒度化概率分布的过程，而深度神经网络擅长学习小尺度结构逐级到认知全局特征，而大模型的Transformer 则可以逆重整化流，逐尺度重建微观概率分布，从而完成生成。

这里的范畴是Transformer视角下的高维概率向量编织起来的事物之间的各种复杂的关系。从海量的预训练数据集中提纯出来，对大量的分段线性核函数参数化后的表达。这些关系，关系的关系，关系的关系的关系，本质上，在范畴论概念下，就是对事物的 米田嵌入 。

最新实证

麻省理工学院 Markus J. Buehler 教授最近在《机器学习：科学与技术》发文【文献1】，展示了一种先进的 AI 方法：集成生成式知识提取、基于图的表征和多模态智能图推理。惊人地揭示了生物组织和贝多芬的“第九交响曲”之间的 复杂性与秩序的共同模式。

该工作使用受 范畴论 启发的方法开发的图作为中心机制，教模型理解科学中的抽象结构和它们之间的符号关系，通过关注对象及其交互，而不是它们的具体内容，来理解和统一不同的系统。

我们知道，范畴论中，对象可以是任何东西，从数字到更抽象的实体，如结构或过程，对应上文笔者讲的 “事物”；形态 则是定义这些对象之间关系的箭头或函数，对应上文中的“ 米田嵌入 ”。

Buehler 教授通过 范畴对象和形态 教会 AI 模型系统地推理复杂的科学概念和行为。通过形态引入的符号关系清楚地表明，AI 不仅仅是在进行类比，而是在进行更深入的推理 ，以映射不同领域的抽象结构。

这也回应了近期大模型究竟会不会推理的业界大辩论。当大模型生成的时候，已经不是那个简单的 next token prediction, 而是基于 丰富范畴 的推理、推理、推理，重要的事情得说三遍。Ilya Sutskever最新访谈提到的「扩大正确的Scaling」，应该指推理的Scaling law。

“苹果称LLM不会推理” 其实是苹果学者 想当然合成了语料 ；字节豆包大模型团队大规模实验发现大模型无法抽象出一般物理规则，从实验看并 无法判断是否局部触发了scaling law。

Buehler 教授通过这个方式，分析了 1000 篇有关生物材料的科学论文，并将其转化为图表征形式的知识图谱。

该图谱揭示了不同信息是如何连接的，并可找到与概念联系在一起的相关想法和关键点组。该图无标度，高度关联，可有效用于 图推理 。

教AI系统思考基于图的数据，以帮助它们构建更好的 世界模型表征 ，并提高思考和探索新想法的能力，以实现超出人类认知的 高维新发现 ：回答复杂的问题，发现当前知识中的差距，提出新的材料设计，预测材料的行为方式，还能够将以前从未连接过的概念联系起来。

生物材料和“第九交响曲”之间 出乎意料的相似之处： 两者都遵循复杂性模式，生物材料中的细胞以复杂但有组织的方式相互作用以形成功能，贝多芬的第九交响曲则以创造一种复杂但连贯的音乐体验为目标安排音符和主题。

通过追踪联系进行图遍历，能够找到以前尚未建立的概念之间的联系，或未理解为以任何已知方式相关的概念。使用生成式 AI 模型的复杂推理可以提供 更深入的见解 ，产生新的信息连接，从而产生新知识，甚至促进新想法的发现。

探索复杂的 图遍历 为分析提供广阔的空间，既可以确定单个 最可能的路径 ，也可以对 多个路径进行采样 。图形是通过合并所有节点来构建的，即使它们来自不同的路径。整体图具有明显不同的拓扑结构，并在边缘编码的概念及其关系之间提供了新颖的联系。表明了非常灵活的图可以被构建并最终用于推理。

图表征了相应领域知识的本体结构，可用于支持该特定科学研究中的推理，例如提出有关材料特性的假设或预测组合不同材料的可能结果，还可以帮助识别知识差距，提出新的研究领域，并促进对材料科学或不同学科之间复杂相互关系的理解。

学者在一项实验中，基于来自瓦西里·康定斯基（Wassily Kandinsky）的画作《构图 VII》中的抽象图案的灵感，AI 提出了一种新的基于菌丝体的复合材料：这种材料结合了一组创新的概念，包括混乱与秩序的平衡、可调节的特性、孔隙率、机械强度和复杂的图案化学功能。

基于宏大的人类知识提取出来 丰富范畴 ，形成众多领域的本体知识结构，这是大模型通过预训练已经构建的内部世界模型；提高推理采样的机制，通过训练达成学习 推理的scaling law ，是大模型下一步努力提升的方向。

相比传统方法，新的大模型机理，具备更高维度的新颖性、对能力和技术细节的探索，可以通过揭示隐藏的联系建立 更广泛有用的创新框架 。AI 知识图驱动的跨学科研究可能会成为科学和哲学探索的有力工具。

文献1: Accelerating scientific discovery with generative knowledge extraction, graph-based representation, and multimodal intelligent graph reasoning https://iopscience.iop.org/article/10.1088/2632-2153/ad7228

数据与代码：https://github.com/lamm-mit/GraphReasoning

阅读最新前沿科技研究报告，欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。 目前拥有超过8000 篇重要资料。 每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或点击本文左下角“阅读原文”进入。

截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

1. 牛津大学博士论文《深度具身智能体的空间推理与规划》230页

2. 2024低空经济场景白皮书v1.0（167页）

3. 战略与国际研究中心（CSIS）人类地月空间探索的总体状况研究报告（2024）

4. 人工智能与物理学相遇的综述（86页）

5. 麦肯锡：全球难题，应对能源转型的现实问题（196页）

6. 欧米伽理论，智能科学视野下的万物理论新探索（50页报告）

7. 《美国反无人机系统未来趋势报告（2024-2029 年）》

8. Gartner 2025 年主要战略技术趋势研究报告

9. 2024人工智能国外大模型使用手册+中文大模型使用手册

10. 详解光刻巨人ASML成功之奥妙-241015（94页）

11. CB Insights：未来变革者：2025年九大科技趋势研究报告

12. 国际电信联盟2023-2024年联合国人工智能AI活动报告388页

13. 《人工智能能力的人类系统集成测试和评估》最新51页，美国防部首席数字和人工智能办公室（CDAO）

14. 2024瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

15. MHP：2024全球工业4.0晴雨表白皮书

16. 世界经济论坛白皮书《AI价值洞察：引导人工智能实现人类共同目标》

17. 瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

18. AI智能体的崛起：整合人工智能、区块链技术与量子计算(研究报告，书）

19. OpenAI o1 评估：AGI 的机遇和挑战（280页）

20. 世界知识产权组织：2024 年全球创新指数（326页）

21. 美国白宫：国家近地天体防御策略与行动计划

22. 【CMU博士论文】持续改进机器人的探索，243页

23. 中国信通院：量子计算发展态势研究报告2024年58页

24. 2024年OpenAI最新大模型o1革新进展突出表现及领域推进作用分析报告

25. 【新书】通用人工智能，144页

26. 联合国：《未来契约》、《全球数字契约》和《子孙后代问题宣言》三合一

27. 世界气候组织：2024团结在科学中，守卫地球系统的未来

28. 世界经济论坛《量子技术助力社会发展：实现可持续发展目标》研究报告

29. 人工智能科学家：迈向全自动开放式科学发现

30. 欧盟：石墨烯旗舰项目十年评估报告

31. 美国信息技术和创新基金会：美国的数字身份之路研究报告

32. 麦肯锡：2024能源转型挑战未来研究报告

33. 联合国贸易与发展会议：2024世界投资报告

34. 兰德：评估人工智能对国家安全和公共安全的影响

35. 兰德：2024评估人工智能基础模型市场的自然垄断条件

36. 经合组织：2015-2022 年生物多样性与发展融资

37. ITIF：中国半导体创新能力研究报告

38. 英国皇家学会：数学未来计划，数学和数据教育的新方法研究报告

39. 欧盟：10年人类大脑计划创新评估报告

40. GLG格理集团：2024深度解读半导体行业关键趋势和专家洞见报告15页

41. 华为智能世界2030报告2024版741页

42. 联合国：2024为人类治理人工智能最终报告

43. 达信Marsh：2024全球科技产业风险研究报告英文版27页

44. 鼎帷咨询：2024英伟达人工智能发展战略研究报告149页

45. 【博士论文】大语言模型的测试与评价：准确性、无害性和公平性，223页pdf

MIT对大模型数理原理的强有力证明

正文

请到「今天看啥」查看全文