主要观点总结
英伟达CEO黄仁勋在年度GPU技术大会(GTC)上发布了多项新产品和技术,涉及GPU架构、数据中心、机器人技术等领域。
关键观点总结
关键观点1: GPU架构升级
英伟达发布了Blackwell架构的升级版Blackwell Ultra,擅长应对AI推理需求。还公布了下一代GPU系列Vera Rubin,以及后续的Vera Rubin Ultra NVL576。长远规划还包括费曼架构,预计在2028年问世。
关键观点2: 网络基础设施升级
英伟达推出了新的硅光子以太网交换机Spectrum-X,每端口提供1.6太比特每秒的速度,为AI工厂节省能源并提高弹性。此外,还展示了将硅光子学直接集成到交换机中的技术。
关键观点3: 个人AI计算机新品
英伟达推出了新款DGX Spark和DGX Station个人AI计算机,旨在让AI开发人员、研究人员、数据科学家和学生在桌面上进行大模型的原型设计、微调和推理。
关键观点4: 开源推理模型系列
英伟达发布了Llama Nemotron Reasoning模型,这是一种任何人都可以运行的AI模型。该模型基于Meta的开源Llama模型,经过算法调整以优化计算要求并保持准确性。
关键观点5: 机器人技术亮点
英伟达展示了Isaac GR00T N1,这是世界上第一个开放、完全可定制的通用人形推理和技能基础模型。还推出了其他新技术,如模拟框架和蓝图,包括用于生成合成数据的Isaac GR00T蓝图。
正文
当地时间 3 月 18 日,在英伟达(NVIDIA)举办年度 GPU 技术大会(GTC)上,CEO 黄仁勋登台发表了主题演讲。
两个小时的时长,从芯片架构和生成式 AI,讲到数据中心、自动驾驶和 AI 工厂,最后到个人 AI 超算和机器人,可谓是量大管饱。
老黄不仅一口气宣布了三个架构升级路线图,一波直接规划到了 2028 年,去年 GTC 登台的 BDX 小机器人也返场登台了,互动和行动似乎更加自然、灵活。
在去年的 GTC 大会上,英伟达发布了 Blackwell 架构,尽管 GPU 量产一度受阻,但近期已实现大规模生产,并在第一季度实现了数十亿美元的销售额。目前,四大云计算公司部署的 Blackwell 芯片数量是 Hopper 芯片的三倍。
今天,英伟达宣布了 Blackwell 架构的升级版 Blackwell Ultra,擅长应对 AI 推理需求。
Blackwell Ultra 以 Blackwell 架构为基础,包括了搭配 CPU 的 GB300 NVL72 机架级解决方案和仅配备 GPU 的 B300 NVL16 系统两个版本。
在表现上,GB300 的 AI 性能比上一代 GB200 高出 1.5 倍。而与 Hopper 一代相比,B300 在大语言模型上的推理速度提高了 11 倍,计算能力提高了 7 倍,内存增加了 4 倍。
老黄表示:“AI 已经取得了巨大的飞跃,推理和代理人工智能需要更高量级的计算性能。我们为这一刻设计了 Blackwell Ultra,它是一个单一的多功能平台,可以轻松高效地进行预训练、后训练和推理人工智能推理。”
Blackwell Ultra 架构将于 2025 年下半年上市,具体参数如下。
图 | Blackwell Ultra NVL72 参数(来源:英伟达)
在这之后,英伟达宣布了其
下一代 GPU 系列
系统名为 Vera Rubin。这个名字来自发现了暗物质的女天文学家 Vera Rubin。
该系统有两个主要组件:一个名为 Vera 的新 CPU 和一个名为 Rubin 的新 GPU 架构。它预计于 2026 下半年问世。
从纸面参数来看,它将全方位超越 Blackwell Ultra,关键性能几乎都是两倍以上的提升。
图 | 下一代架构 Vera Rubin NVL144(来源:英伟达)
这还没完,接下来亮相的产品(ppt)是 Vera Rubin 的下一代,Vera Rubin Ultra NVL576。纸面性能又是一波暴涨。
图 | 下一代架构升级版 Vera Rubin Ultra NVL576(来源:英伟达)
“Vera Rubin Ultra 拥有 250 万个零件,并连接到 576 个 GPU。”老黄表示。不过他也承认有些规划“过于超前”,但“这就是我们向前发展的速度”。
反过来看,我们也再一次见识了老黄的刀法,产品还没出来,就已经想好怎么刀了。
图 | Hopper、Blackwell 和 Rubin 性能对比(来源:英伟达)
那你可能要问了,Rubin Ultra 之后是什么呢?
至少名字英伟达想好了,以数学家理查德·费曼(Richard Feynman)命名的费曼架构,预计在 2028 年问世。
图 | 2025-2028 架构规划路线图(来源:英伟达)
介绍完了 GPU 架构,老黄谈到了其他的英伟达产品线。
首先是以太网设备升级。
改善网络本身将有助于使 AI 的工作过程更加顺畅,为此英伟达宣布推出新的 Spectrum-X 硅光子以太网交换机,该交换机每端口可提供 1.6 太比特每秒的速度,从而为 AI 工厂节省 3.5 倍的能源并提高 10 倍的弹性。
该产品是英伟达 Spectrum-X 光子以太网和 Quantum-X 光子 InfiniBand 平台的一部分。
英伟达表示,与传统方法相比,它们的光学技术创新使用了更少的激光器(减少 4 倍),还能实现 3.5 倍的能效、63 倍的信号完整性、10 倍的大规模网络弹性和 1.3 倍的部署速度提升。
“AI 工厂是一种规模极大的新型数据中心,网络基础设施必须重新改造才能跟上步伐。通过将硅光子学直接集成到交换机中,英伟达打破了超大规模和企业网络的旧有限制,为百万 GPU AI 工厂打开了大门。”老黄表示。
接下来,
老黄介绍了新款 DGX Spark 和 DGX Station 个人 AI 计算机,他将其描述为“AI 时代的超级计算机”。