专栏名称: AI范儿
AI领域四大媒体之一。 智能未来,始于Prompt!
目录
相关文章推荐
信息平权  ·  聊聊 CES 爆火的 AI 眼镜 ·  昨天  
信息平权  ·  聊聊 CES 爆火的 AI 眼镜 ·  昨天  
看金坛  ·  “秒空”!最高溢价150%! ·  4 天前  
看金坛  ·  “秒空”!最高溢价150%! ·  4 天前  
江西日报  ·  刚刚!雷军官宣:全面开放参观预约 ·  4 天前  
江西日报  ·  刚刚!雷军官宣:全面开放参观预约 ·  4 天前  
好机友  ·  499元的红米14C正式开卖,这回我是真想买 ·  6 天前  
51好读  ›  专栏  ›  AI范儿

黄仁勋 CES 主题演讲完整内容:显卡、游戏、AI、自动驾驶、机器人、DGX

AI范儿  · 公众号  · 硬件 科技自媒体  · 2025-01-07 13:23

主要观点总结

本文主要总结了NVIDIA在CES上的主题演讲,包括发布的新产品、技术突破以及合作等。重点介绍了NVIDIA的新游戏系列RTX 5000,其性能提升显著,包括着色性能、光线追踪性能和AI性能等。另外,还提到了NVIDIA在AI领域的新技术,如Nemotron、Cosmos和AI代理开发平台等。同时,NVIDIA在汽车业务方面也取得了重要进展,与Toyota达成了开发下一代自动驾驶汽车的战略合作。最后介绍了NVIDIA的DGX系统和GB10超级芯片。

关键观点总结

关键观点1: NVIDIA在CES上的主题演讲精彩纷呈,带来了多款新产品和技术突破。

包括RTX 5000游戏系列、AI技术突破、汽车业务合作等。

关键观点2: RTX 5000系列游戏显卡性能提升显著。

着色性能提升1.5倍,光线追踪性能翻倍,AI性能提升3倍。

关键观点3: NVIDIA推出了多项新技术。

包括Nemotron、Cosmos和AI代理开发平台等,为AI领域带来新的突破。

关键观点4: NVIDIA与Toyota达成了开发下一代自动驾驶汽车的战略合作。

这是NVIDIA在汽车业务方面的重要进展。

关键观点5: NVIDIA的DGX系统和GB10超级芯片是值得关注的产品。

DGX系统集成了多种新技术,GB10超级芯片则是NVIDIA近年来最接近消费级SoC的产品。


正文

在今天 CES 众多主题演讲中,最受瞩目的无疑是开幕主题演讲。今年由 NVIDIA 担纲的这场传统启幕演讲向所有与会者开放。如果一切按照 NVIDIA 的计划进行,这场演讲将为整个展会定调。


Jensen 登场了。"欢迎来到 CES!"

Jensen 身着拉斯维加斯风格夹克

"欢迎来到 NVIDIA。其实,你们此刻正身处 NVIDIA 的数字孪生世界中"

"这里的一切都是 AI 生成的"

Jensen 开始回顾 NVIDIA 的发展历程,从 1993 年的 NV1 芯片说起。

NV1

这款芯片曾应用于世嘉的 Virtua Fighter (1) 街机游戏。

1999:可编程 GPU

CUDA AI 发展史

当然,他也提到了 GPU 在 AI 处理领域的发展历程,这段历史始于 2012 年的 ALEXNET。

下一个革新?物理 AI。看来今晚我们将详细了解这项技术。

2018 年,随着 Google 创造并发布 transformers 技术,AI 领域又实现了一次重大突破。

Transformers

"在过去 12 年里,技术体系的每一层都发生了翻天覆地的变化"。

NVIDIA CES 2025 游戏展示

"所有这些 [AI] 技术都建立在 GeForce 的基础之上,而现在 AI 正在回归 GeForce 平台"

RTX Blackwell 实机演示

现场播放的演示视频全部由 NVIDIA 新推出的 "RTX Blackwell" 实时捕获。

这种效果如果没有人工智能技术支持将无法实现。

通过 AI 技术推断未渲染的像素 (DLSS)。新一代 DLSS 技术突破性地实现了在当前帧基础上预测未来最多 3 帧的能力。

在实际运算中,NVIDIA 仅计算了 200 万像素,就能让 AI 准确预测出另外 3300 万像素。

Jensen 讲解像素生成技术

"今天,我们很自豪地发布新一代产品:RTX Blackwell 系列"

这款产品搭载了 920 亿晶体管,算力高达 4000 TOPS。

RTX Blackwell 技术规格

配备两个双着色器,分别负责浮点运算和整数运算。

采用 Micron 的 GDDR7 显存,内存带宽达到 1.8TB/秒。

最重要的是,它能够同时处理 AI 和图形计算任务。

可编程着色器现在已具备处理神经网络的能力。

RTX Blackwell 显卡外观

RTX Blackwell PCB 细节

与售价 1599 美元的 RTX 4090 系列相比,新品具有显著优势:

RTX 5070 仅需 549 美元就能达到 4090 的性能水平。

RTX 5070

高端型号 RTX 5090 的售价为 1999 美元。

RTX 5000 产品线

同时发布的还有笔记本电脑产品线,搭载 RTX 5070 移动版的笔记本起售价为 1299 美元。

RTX 5070 笔记本电脑

"这些产品的能效比令人惊叹"

"这场主题演讲的节奏异常紧凑"

RTX 5000 笔记本产品线

特别值得关注的是,NVIDIA 开始使用 TOPS (每秒万亿次运算) 作为 GPU 性能的衡量标准。第一批 RTX 5000 系列显卡将于本月发布,我们很快就能了解到更多细节。

NVIDIA CES 2025 AI 主题探讨

接下来议题转向更宏观的 AI 发展讨论。

AI 规模化发展

Jensen 阐述了 AI 的扩展定律,指出目前已形成预训练、后训练和"推理"三大核心定律。

AI 扩展定律详解

后训练(即强化学习)是第二个定律。最新加入的是推理(测试时扩展)定律,它实现了 AI 在实际使用过程中的持续优化,能够准确判断产生所需答案类型时的实际计算需求。

这些技术突破都需要海量计算资源支持。在计算资源有限的约束下,市场对 NVIDIA Blackwell 的需求激增。

NVIDIA Blackwell

NVIDIA 的 Blackwell 已进入全面量产阶段。通过 NVIDIA 自有产品线和 OEM 合作伙伴网络,他们有能力服务全球几乎所有的数据中心。

"我们如此大力推进的原因在于计算力需求的急剧增长"

NVIDIA Shield? (与传统 SHIELD 不同)

Jensen 首先展示了一个外形酷似放大版 Blackwell GPU 的设备(编注:实际是 Blackwell NVL72)

这些 AI 服务器的制造工艺达到了"惊人"的水平。

"仅用一代产品更新,我们就将这些模型的训练成本降低了三分之二。"

当前数据中心的发展主要受限于功耗。因此,正如 Jensen 所说,上一代产品在能效比方面的所有提升都能直接转化为更高收益。

Grace Blackwell NVLink72

显然,Jensen 对 NVL72 的成就感到无比自豪。

(在这个宽阔的舞台上来回走动后,他略显疲态)

"我们的目标是显著提升 token 生成速率",同时降低单个 token 的成本,以支持 AI 的整体规模化发展

测试时扩展技术

Jensen 展示了 AI 代理的多个应用场景。

随着输出质量的提升,测试时扩展所需的计算资源将呈指数级增长。

NVIDIA 一直将面向用户的 AI 代理作为重点应用方向,这是该理念的最新发展。这些应用都基于 NVIDIA 的硬件平台、深度软件栈和丰富的模型库构建。

展望未来,AI 代理将成为企业的数字员工,与人类员工协同工作。(它们甚至需要接受入职培训,通过专门的库来学习企业特定知识)

"今天我们还要宣布 [...] 一个全新的基于 Llama 的模型家族:NVIDIA Llama Nemotron 语言基础模型。"

Nemotron

NVIDIA 正在为企业应用场景优化 Llama 模型,推出三个版本:Nano (小型)、Super (主流) 和 Ultra (大型训练版)。

谈到软件编码领域:"这将成为下一个重要的 AI 应用突破点"

AI 代理"很可能带来万亿美元级的市场机遇。"

随后播放了一段视频,展示用户可以如何运用 AI 代理。

AI 代理

AI 代理应用示例

看到观众反应平淡,Jensen 解释道:"这不是生成的演示"

"我们最终的目标是将 AI (能力) 带到个人电脑平台"

当前的 Windows 操作系统架构并不完全适合 AI 运算。

"如果能将 Windows PC 打造成世界级的 AI PC,那将是一个重大突破"

解决方案就是 Windows Subsystem for Linux v2 (WSL2)

WSL2

看来 NVIDIA 的策略是在包括 Windows 在内的所有平台上都采用 Linux 作为 AI 软件生态系统的基础。

NVIDIA 计划将基于 WSL2 的 Windows 打造成一流的目标平台。

这一计划也获得了主要 OEM 厂商的支持。据 Jensen 透露,这些厂商正在为适配这一软件架构做准备。

NVIDIA CES 2025 物理 AI 专题

接下来,演讲转向了"物理 AI"这个令人期待的主题。

物理 AI

transformer 模型的计算负载如此之大,主要是因为其计算成本会随着 token 数量呈现平方级增长 O(n^2)。

"我们需要一个能够理解世界的基础模型"

由此,NVIDIA 重磅发布:Cosmos,这是一个专门设计用于理解物理世界的基础模型

随后播放了演示视频。

NVIDIA Cosmos

该系统能够基于合成数据生成超写实的虚拟世界,并将这些生成的世界用于强化学习训练。

(这个描述让人联想到 NVIDIA 此前的机器人技术,不过这次是从 AI 语言的角度重新诠释)

Cosmos 经过了长达 2000 万小时的视频训练。

"这就是在教 AI 认知物理世界。"

Cosmos 采用开源许可证,已在 GitHub 平台发布。与 Nemotron 一样,它提供 Nano (入门)、Super (主流) 和 Ultra (高端) 三个版本。

集成 Cosmos 的 Omniverse

NVIDIA 提出机器人技术需要一个三机协同的解决方案:DGX 系统负责基础训练,搭载 Cosmos 的 Omniverse 处理优化和强化学习,最后由 AGX 在现实环境中执行推理任务。

NVIDIA 机器人三机协同方案

NVIDIA 已经吸引了大量致力于实现这一愿景的生态系统合作伙伴。

NVIDIA 机器人生态系统

最后播放了一段关于机器人项目合作的视频,展示内容全部基于数字孪生技术的模拟场景。

NVIDIA CES 2025 汽车技术专题

"自动驾驶革命的时代已经来临"

NVIDIA 自动驾驶汽车技术

今天的重磅消息是 NVIDIA 与 Toyota 达成战略合作,共同开发 Toyota 的下一代自动驾驶汽车。

"这很可能成为首个突破万亿美元规模的机器人产业"

该业务板块今年的年化营收已达 50 亿美元。

同时发布的还有下一代汽车计算平台:基于 NVIDIA Thor 芯片的 Hyperion 9。

NVIDIA Thor

Thor 芯片已开始量产,其处理能力较上一代 Orin 提升了 20 倍。

除了汽车领域,Thor 还可应用于传统机器人领域。

另一个重要突破是:DRIVE OS 成为首个获得 ASIL-D 认证的软件定义 AI 计算机系统。"这是独一无二的最高级别认证"

NVIDIA DRIVE OS

ASIL-D 是汽车安全完整性等级认证中的最高级别。获得这一认证意味着系统在安全性方面达到了行业最严格的标准。

随后的视频展示了 NVIDIA 如何运用各种 AI 工具和技术来训练自动驾驶模型。

NVIDIA DRIVE 平台

NVIDIA 一直强调训练的关键作用。要实现安全可靠的自动驾驶系统,需要进行海量训练。其中,合成数据生成技术是 NVIDIA 提升训练规模的重要手段之一。

预计在未来几年,自动驾驶技术的发展将进入快车道。

NVIDIA CES 2025 机器人技术专题

最后一个主题转向机器人技术领域。

Jensen 的机器人军团

在这个领域,最关键的挑战是机器人的训练方法。与自动驾驶汽车的训练相比(只需要实际驾驶),让机器人学习人类工作方式要复杂得多。

随后播放的视频展示了人形机器人及其配套 AI 模型的最新进展。

NVIDIA Isaac Groot

团队采用远程操作和人体动作捕捉技术创建基础训练样本,再通过算法生成大量变体用于深度训练。

"我们将积累海量的机器人训练数据"

NVIDIA CES 2025 DGX 系统专题

最后一个环节,Jensen 介绍了 NVIDIA 自主研发的 DGX 系统。他首先回顾了 DGX 的发展历程,提到公司于 2016 年推出首款 DGX 产品。

"现在回想起来,真希望第一代 DGX-1 能做得更小巧一些"

Project Digits

重磅发布 Project DIGITS:一款紧凑型 NVIDIA AI "超级计算机"。

核心是全新的 GB110 芯片,这是 NVIDIA 推出的尺寸最小的 Blackwell GPU。

GB10 超级芯片

GB110 已进入量产阶段。它将整合到 GB10 超级芯片中,这是一款结合了 Grace 和 Blackwell 技术的复合芯片。值得注意的是,该项目似乎是与 MediaTek 合作开发的,这个组合相当有趣...

NVIDIA Project DIGITS

产品计划在 5 月正式发布。

除了 AI 计算,它还可以作为 Linux 工作站使用,远超普通工业 PC 的定位。

配置方面,搭载 20 核 Arm CPU、小型 Blackwell GPU 和 128GB LPDDR5X 内存。GB10 的架构类似现代 SoC,但没有集成 I/O。可以预见,NVIDIA 不会仅仅将其局限于开发者迷你 PC 这一应用场景。

Project Digits 工作站

总结环节。NVIDIA 已实现三款新型 Blackwell 产品的量产,2025 将是充满突破的一年。

演讲最后,播放了一段回顾 NVIDIA 近期所有成就的精彩视频。

NVIDIA 总结回顾

"祝各位在 CES 期间收获满满!"

至此,整场演讲圆满结束。

总结点评

作为今晚的压轴演讲,NVIDIA 在 CES 上的表现可谓精彩纷呈,尤其是在游戏领域带来了重大突破。

消费市场最引人注目的无疑是采用 Blackwell GPU 架构的 GeForce RTX 5000 系列。虽然演讲中没有透露太多细节(预计不久后会有专门的发布会),但用于 GeForce RTX 5090 的顶级 Blackwell GPU 规格令人惊叹:集成了 920 亿晶体管,配备最新的 GDDR7 显存。

相比上代旗舰 Ada 芯片,新品在不同场景下都实现了显著提升:着色性能提升 1.5 倍,光线追踪性能翻倍,AI 性能更是提升了 3 倍。后者的巨大进步主要得益于新增的低精度 FP4/INT4 数据类型支持。

此外,GeForce 系列还将迎来多项新功能,包括升级版的延迟优化工具 Reflex 2、支持生成最多 3 帧插帧的 DLSS 4,以及神经纹理技术。这些创新都建立在 NVIDIA 可编程 CUDA 着色器核心增强的 AI 和着色器混合运算能力之上。

RTX 5000 系列将从本月起陆续发布:旗舰款 RTX 5090 定价 1999 美元(较 4090 涨价 400 美元),RTX 5080 售价 999 美元(降价 200 美元),RTX 5070 Ti 售价 749 美元(降价 50 美元),RTX 5070 售价 549 美元(降价 50 美元)。考虑到晶圆成本持续上涨和 NVIDIA 的市场主导地位,大多数型号降价着实让人意外。人们也很好奇新卡在各个价位档次的具体硬件配置和晶体管规模。

GB10 超级芯片是另一个值得关注的亮点。这款(看似)采用多芯片封装的产品集成了 20 核 Arm CPU 和 Blackwell GPU。虽然不是完整的 SoC(I/O 接口似乎位于独立芯片),但这是 NVIDIA 近年来最接近消费级 SoC 的产品。它将首先应用于售价 3000 美元、计划 5 月发布的 Project DIGITS 迷你电脑。

在 AI 领域,NVIDIA 主要推出了软件层面的创新:用于优化 Llama 模型的 Nemotron,能够从合成世界生成超写实图像的 Cosmos,以及配套完整工具链的 AI 代理开发平台。汽车业务方面也传来好消息:Orin SoC 已进入量产阶段,同时与 Toyota 达成了开发下一代自动驾驶汽车的战略合作。

© AI范儿

要进“交流群”,请关注公众号获取进群方式

投稿、需求合作或报道请添加公众号获取联系方式


往期推荐

英伟达正式发布 RTX 5090 GPU,性能是 4090 两倍


点这里👇关注我,记得标星哦~

点个在看你最好看