专栏名称: 果壳
果壳网(Guokr.com)是开放、多元的泛科技兴趣社区。
目录
相关文章推荐
混沌巡洋舰  ·  集体无意识的定量大模型研究 ·  4 天前  
科普中国  ·  新突破!-36℃极寒环境,试飞成功 ·  昨天  
原理  ·  人类语言究竟是何时出现的? ·  2 天前  
科学网  ·  李德平院士逝世 ·  2 天前  
51好读  ›  专栏  ›  果壳

盯着英伟达的股价,老黄心生一计

果壳  · 公众号  · 科学  · 2025-03-19 09:41

正文

去年的GTC,老黄(黄仁勋)称之为“AI 届的伍德斯托克”,在 AI 浪潮里,邀请各家一起狂欢。



今年的GTC,老黄称之为“AI 届的超级碗”: 纵使各家竞争激烈,但英伟达出场后,要让在场的每个人都做赢家。


“全世界都错了”


一个字总结老黄前半个小时的演讲:怼。


AI 经历了这样的演变趋势,从预测式 AI 到这一波生成式 AI,再到当下最火的 Agentic AI(代理型AI,能自主决策和操作,比如 Manus),最后步入基于物理世界,由机器人引领的物理 AI(Physical AI)。



但是, “去年,全世界几乎都搞错了。”


对于预训练的 Scaling Law,很多 AI 届的大佬纷纷出来表示已经到头了,继续单纯堆算力、数据和模型参数,对模型性能提升已经趋于瓶颈,未来增长不会像过去那么快,但成本却在指数级增长。


而后 DeepSeek 也证明了非“堆料”而是通过聪明的工程设计和高效的训练方法“精耕细作”的可能性。


但是黄仁勋强调了推理阶段的 Scaling Law才刚开始,回答问题前思考得越多,推理效果就越好,这是一个运算密集的过程。


以让AI来排婚礼宴请席位为例,推理模型(DeepSeek R1 来佐证)消耗的算力是传统大语言模型的 150 倍,token 消耗量也是 20 倍。



除非 AI 发展停留在生成式AI阶段,不向老黄 mapping 的下一个阶段迈进,不然 Scaling Law 就没到头,对于算力和数据需求还在增加。


DeepSeek 让英伟达股价遭到重挫,一夜蒸发 6000 亿美元,到现在也没恢复回去。为了提振市场信息,老黄放出预测:


最近两年只是 AI 浪潮的开始,随着 AI 大模型和推理计算需求激增,数据中心的资本开支会爆发式增长,到 2028 年,整个市场规模突破1万亿美元。而英伟达正是该市场的主导者和核心供应商。



“如果 GTC只留一页 PPT,就是这页。”



PPT 上展示了 CUDA-X(一系列封装为云API 的开发者工具、GPU 加速库和技术)已经应用到了物理仿真、数据科学、计算机辅助工程、深度学习、量子计算、天气模拟、医疗影像、基因测序、决策优化、无线通信、光刻计算、数值计算这些高精尖的科技行业。



英伟达建立的良好的 CUDA 生态帮助 GPU 计算渗透到各行各业,堪称人类科技树的“种子”。


“我们已经抵达计算的临界点——CUDA 让这一切成为可能。”


比如在自动驾驶领域,英伟达宣布了与通用汽车的合作。通用计划采用配备 Blackwell 架构并运行 NVIDIA  DriveOS 操作系统的 NVIDIA DRIVE AGX,作为车载硬件来支持未来的高级驾驶辅助系统和车内安全功能。


另外用 Omniverse 训练 AI 制造模型,以优化通用汽车的工厂规划和机器人技术。


老黄颇为骄傲地称,几乎每家自动驾驶汽车公司都用了英伟达的技术,包括软硬件。此外还展示了 Nvidia Halos,一个关于汽车安全的AI解决方案。Nvidia Halos 是由 Omniverse 和 Cosmos 训练出来的,前者负责生成场景,后者负责把车辆放入场景进行高精度物理模拟。


通常,黄仁勋讲述完 AI 世界进展和对其新的理解后,“秀肌肉”开始了。


堆料,狠狠地堆料


首先,老黄展示了正在全面生产中的 Grace Blackwell 架构,它支持高达 1000 万亿次运算每秒(TOPS)的 AI 计算性能,英伟达已经给各大科技巨头做出了定制版,并说“客户需求量难以置信”。



面对是 scale out 还是 scale up的问题,老黄的答案是, “Before you scale out,scale up first."( 在你增加数量前,你先把单机性能做上去)


不仅要堆料,而且要狠狠地堆料(Most scale up)。


老黄还切了张 PPT 来说明自己的观点:性能都是为了更好地服务,大规模推理任务是对算力的极端考验。老黄推断,下一代模型需要万亿级的参数量。



英伟达推出了 Blackwell Ultra 芯片,GB300 NVL72 采用机架级设计,连接72块Blackwell Ultra GPU。


根据英伟达官方博客,Blackwell 已经实现了让DeepSeek-R1 打破推理性能的世界纪录。


而GB300 NVL72 的带宽是前代 GB200 的两倍,内存速度是前代的 1.5倍。


在 2022 年的 GTC 上老黄发布了 Hopper 架构,去年发布了 Blackwell 架构。


结果英伟达重新定义了摩尔定律。Blackwell 架构相比 Hopper 架构可将性能提升 25 倍,在推理性能上提升 40 倍,单位计算成本也大幅下降, 老黄因此推销道“你买的(BlackWell)越多,你省的(计算成本)越多。”



“当技术发展如此迅猛时……我们希望大家投资在正确的版本上。”说完,老黄调侃自己不是 CEO, 是首席营收破坏者 CRD(Chef Revenue Destroyer) 。Blackwell Ultra GB300 NVL72 将于 2025 年下半年上市。







请到「今天看啥」查看全文