我们参加了创始人兼首席执行官黄仁勋于 2025 年在拉斯维加斯国际消费电子展(CES)上发表的主题演讲。在他的演讲中,重点介绍了一系列新产品、服务及合作项目,其中包括 RTX Blackwell(即游戏 GPU)。不过,此次演讲尤其聚焦于物理人工智能领域,黄先生分享了他的愿景,即机器人行业的 “ChatGPT 时刻” 即将迅速来临。
英伟达发布的产品和合作公告往往难以转化为具体的预测。尽管如此,我们认为,今天这一连串的公告至少彰显了该公司在硬件和软件领域以行业领先速度进行创新的能力,以及其强大的合作伙伴和客户生态系统。随着 Blackwell 全面投产,规模定律依然发挥着重要作用(尤其是考虑到训练后规模和测试时间规模,即 “推理”),而且各大超大规模数据中心运营商仍处于激烈的竞争之中,我们对英伟达的中短期盈利增长前景依然持乐观态度。因此,我们重申对其股票的 “买入” 评级(该股票也在我们的 “确信买入名单” 中),并设定的 12 个月目标价为 165 美元,这一目标价是基于我们预估的标准化每股收益(EPS)3.30 美元的 50 倍得出的。重要的是,我们认为,物理人工智能领域若能早日带来显著的收入贡献,将有可能延长当前人工智能基础设施的建设阶段,进而消除投资者对行业周期的担忧。
演讲关键要点
RTX Blackwell 系列:黄先生向游戏玩家、创作者和开发者介绍了基于 Blackwell 架构的 GeForce RTX 50 系列桌面和笔记本 GPU。借助 AI 驱动的渲染技术(即 AI 通过每渲染一帧生成三帧来提升帧率),RTX 5090 的性能将是 RTX 4090 的两倍,而售价 549 美元的 RTX 5070 将拥有与售价 1599 美元的 RTX 4090 相近的性能。GeForce RTX 5090 GPU 拥有 920 亿个晶体管,具备 3352 AI TOPS 的计算能力。
三大规模定律:与黄先生在 11 月公司财报电话会议上传达的信息一致,他强调未来有三大规模定律将推动对加速计算的需求:a) 预训练规模(即对更多数据应用更多计算,以驱动生成更高质量的模型);b) 训练后规模(即利用强化学习提高输出质量);c) 测试时间规模或推理(即模型发展推理和思考能力)。
Blackwell 全面投产:与一些投资者的担忧不同,黄先生强调基于 Blackwell 的系统已全面投产,并且每家云服务提供商都已启动并运行基于 Blackwell 的系统。他还谈到,随着包括 OpenAI 的 o1 和 o3 以及谷歌的 Gemini Pro 等模型的复杂程度不断提高(即发展推理和思考技能),有必要降低计算成本。他特别指出,与 Hopper 相比,Blackwell 的每瓦性能提升了 4 倍,每美元性能提升了 3 倍。重要的是,我们预计英伟达将持续创新,在可预见的未来持续降低每计算单元的成本。近期的推动因素包括 2025 年下半年推出 Blackwell Ultra 以及 2026 年推出 Rubin。
英伟达 Llama Nemotron 语言基础模型:黄先生宣布了英伟达 Llama Nemotron 语言基础模型,该模型基于 Meta 的 Llama 大语言模型(LLM),并针对企业的代理式 AI 进行了优化。这些模型旨在帮助开发者创建和部署定制化的 AI 代理,以协助处理广泛的应用场景,包括欺诈检测、客户支持和库存管理优化等。Llama Nemotron 模型系列将有三种尺寸,为不同规模的部署提供选择:a) Nano - 针对低延迟实时应用进行成本优化;b) Super - 为高吞吐量应用场景设计;c) Ultra - 为追求最高精度和数据中心规模应用而设计。
英伟达 Cosmos:英伟达还宣布了 Cosmos,这是一个综合性平台,由 “世界基础模型”、分词器和数据处理工具组成,旨在助力自动驾驶汽车和类人机器人等物理 AI 系统的发展。虽然从资金投入以及数据测试强度的角度来看,这些系统成本极高,但 Cosmos(英伟达已以开放模型许可的方式提供)通过用于训练和评估的合成数据,使开发过程更具普遍性。Cosmos 的应用场景包括:a) 与 Omniverse 配合使用,生成 AI 模型可能采取的所有未来结果,以选择最佳路径;b) 让开发者能够轻松从视频数据中找到特定的训练场景,如雪天路况或仓库拥堵;c) 从 Omniverse 平台创建的可控 3D 场景中生成逼真的视频。
推进三类机器人研发:英伟达旨在推动三类机器人的研发。若研发成功,这将成为 “世界上有史以来最大的科技产业”,这三类机器人分别是:1) 代理式 AI 机器人;2) 自动驾驶汽车;3) 类人机器人。开发这些技术,尤其是类人机器人技术的关键一步是处理模仿信息。虽然这往往是一个相当繁琐的过程,但英伟达试图通过 Omniverse 合成生成的动作来缓解这一瓶颈。这使得模仿训练可以独立于人类的实际演示进行,从而显著缩短训练时间。
英伟达 DIGITS 项目:与超级计算机规模不断增大的趋势相反,英伟达推出了 DIGITS,这是一款搭载 GB10 Grace Blackwell 超级芯片的片上系统,拥有 128GB 一致性内存和高达 4TB 的 NVMe 存储,其外形尺寸经过优化,能够放置在桌面上。DIGITS 片上系统架构设计得到了联发科的支持,并采用了 GB10(Grace CPU / Blackwell GPU)超级芯片。这个计算单元能够运行参数高达 2000 亿的大语言模型,具备 1 千万亿次浮点运算的 FP4 精度,并且可以使用英伟达丰富的 AI 软件和云套件。最终,DIGITS 为研究人员和开发者提供了广泛的超级计算能力,使他们能够在不依赖外部或云端 AI 加速集群的情况下训练和推理模型。据英伟达称,DIGITS 将于 2025 年第二季度推出,起售价为 3000 美元。