核心观点
►
从
HGX到MGX,英伟达强调供应体系的绝对主权
:
从
HGX到DGX到现在MGX,英伟达已经成功转型,从芯片模组厂商转变到服务器厂商,其自身的商业价值进一步增强,此外由于其商业产品形态的改变,其供应链竞争格局也发生改变
。
MGX与
DGX的逻辑相似,英伟达自主设计服务器,然后通过OEM厂商代工,从而出货给CSP或非CSP厂商,OEM在此种的份额较大。此时产业链话语权由英伟达主导。
因此
OEM厂商迎来利好,在GB200具有跨时代意义的背景下,
OEM厂商在英伟达体系代工份额会进一步提升。
北美四云对
Capex预算乐观,坚定发力人工智能,英伟达预期业绩依旧乐观:微软预计2024年持续扩大人工智能的投资规模与产能,环比大幅增长,谷歌预计2024年剩下季度保持不低于120亿美元资本支出。Meta上调Capex指引从300亿美元-350亿美元至350亿至400亿美元,预计2025年资本支出持续增加。亚马逊预计2024年整体资本支出将大幅增长
。
供给侧:
台积电给与
AI今年乐观指引。2024年4月18日,公司公布2024年Q1季报,公司明确表明人工智能需求强劲,人工智能2024年收入占比有望达到十几个点,公司预计未来五年其收入复合增长率将达到50%
。HBM厂商同时给出乐观指引。
此外根据
Semianylasis的测算
在像
GPT-4 这样的大模型中,B200 在 GPT-4 推理中带来约 4 倍到 7 倍的性能提升,当量化公平设置时,具体取决于选择的交互性曲线点。相比之下,GB200 的提升范围从约 5 倍到 21 倍——更大的提升。模型生成方面落后于大公司的人
有望购买
GB200 用于他们的大模型训练和推理。
因此,在万亿参数
AIGC的大背景下,GB200的出货预期指引依旧乐观
。
抓住核心供应链变化,把握弹性:1、供应链份额的变动,例如OEM份额的提升;2、新进入供应链体系厂商,例如铜链接、液冷、电源等。
代工
:工业富联、浪潮信息等;
电源
:麦格米特等;
1、政策不及预期的风险;2、AI伦理风险;3、技术升级不及预期的风险;4、中美贸易摩擦升级的风险。
1.
英伟达宣布AI主权,不断上调的GB200预期
►
从HGX到MGX,英伟达强调供应体系的绝对主权
什么是HGX?
HGX是NVIDIA HGX 采用单一基板,配备 4 个 H200 或 H100 GPU 或是 8 个 H200、H100、B200 或 B100 GPU。这些强大的硬件和软件组合为打造强劲的 AI 超级计算平台奠定了基础。
简而言之,
我们判断HGX在于供应体系的开放,换句话说,英伟达供应链ODM厂商可以购买英伟达板卡然后自主设计服务器,然后售卖给CSP厂商或非CSP厂商,此时服务器话语权由ODM厂商主导。
什么是
DGX?
英伟达
官网给出的定义是NVIDIA DGX™ 系统针对企业大规模 AI 基础架构提供出色的解决方案。简而言之,我们判断DGX是英伟达一站式AI的解决方案,此时英伟达已经开始宣布AI的主权,简而言之,DGX在于供应体系的缩窄
,英伟达自主设计服务器,然后通过OEM厂商代工,从而出货给CSP或非CSP厂商,OEM在此种的份额较大。此时产业链话语权由英伟达主导。
此外,由下图官网上的购买窗口,也能佐证我们的观点。
什么是MGX?
官网给出的解释是通向加速计算最快、最灵活的途径,MGX 通过提高 ROI 和缩短上市时间为模块化服务器设计提供了新标准。简而言之MGX是模块化的服务器,目前产品只有NVIDIA GB200 NVL,我们判断与DGX的逻辑相似,英伟达自主设计服务器,然后通过OEM厂商代工,从而出货给CSP或非CSP厂商,OEM在此种的份额较大。此时产业链话语权由英伟达主导。
重点强调,从HGX到DGX到现在MGX,英伟达已经成功转型,从芯片模组厂商转变到服务器厂商,其自身的商业价值进一步增强,此外由于其商业产品形态的改变,其供应链竞争格局也发生改变。
1、
OEM
:
英文Original Equipment Manufacturer的缩写,也称为定点生产,俗称代工(生产),基本含义为品牌生产者不直接生产产品,而是利用自己掌握的关键的核心技术负责设计和开发新产品,控制销售渠道。对应的是Turnkey生产模式。
2、
ODM
:
英文是Original Design Manufacturer,直译就是“原始设计制造商”。ODM是指某制造商根据另一家厂商的规格和要求,设计和生产产品,并要求配上后者的品牌名称来进行销售。对应Buy and sell 生产模式
3、
JDM
:
英文是Joint Design Manufacturer,直译为共同设计制造。对应Cosign生产模式。
我们判断英伟达已经从芯片板卡公司转向服务器公司,并强调AI的绝对主权,因此在GB200具有跨时代意义的背景下,更利好英伟达以及其OEM厂商,OEM厂商在英伟达体系代工份额会进一步提升。
英伟达在今年的GTC大会上发布了其性能怪兽,而其中最重磅的代表为DGX GB200完整服务器:
根据机器之心公众号,基于 Blackwell 的 AI 算力将以名为 DGX GB200 的完整服务器形态提供给用户,结合了 36 颗 NVIDIA Grace CPU 和 72 块 Blackwell GPU。这些超级芯片通过第五代 NVLink 连接成一台超级计算机(后文简称GB200 NVL 72)。与相同数量的72个H100相比,GB200 NVL72的性能大幅提升,大模型推理性能可以提升30倍,并且成本和能耗只有前者的
1/25。
这是一个全机架解决方案,有
18个1U服务器。其提供的FP8性能为720 petaflops,FP4计算性能为1440 petaflops,可处理
多达27万亿个AI LLM参数模型。每台服务器里带有两个GB200 Grace Blackwell Superchip
,
这些计算节点带有
1.7TB的HBM3E内存、32TB/s的内存带宽,并且全部采用液冷MGX封装。
然而由于功耗过大,需要采用液冷。
从整机系统构造来说,英伟达发布全新的
Blackwell架构DGX SuperPOD,适用于万亿参数级的生成式AI超级计算
:
基于先进的
NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群中 Grace Blackwell 超级芯片的数量扩展至数万个,通过 NVIDIA NVLink 可将多达 576 块 Blackwell GPU 连成一个整体,由 NVIDIA 系统专家加速即时 AI 基础设施的部署。
全新
DGX SuperPOD 采用新型高效液冷机架级扩展架构,基于 NVIDIA DGX
™
GB200 系统构建而成,在 FP4 精度下可提供 11.5 exaflops 的 AI 超级计算性能和 240 TB 的快速显存,且可通过增加机架来扩展性能。
简而言之,它将八个
GB200 NVL72合
为一体
,总共有288个CPU、576个GPU、240TB内存和11.5 exaflops的FP4计算能力。
黄仁勋
更是在GTC上直言“DGX Superpod就是AI的革命工厂!”
需求端:北美四云CAPEX指引依旧乐观,
我们认为互联网厂商
Capex预算决定英伟达业绩预期上限
,
原因在于北美四云的AI Capex受自身模型的商业化进程影响,同时北美四云在AI的市场中占据举足轻重的位置,原因是自身模型处于市场前沿,因此自身对于算卡的需求占据AI市场的半壁江山,而英伟达又是AI芯片的绝对龙头,因此我们判断北美四云的Capex指引对于AI算卡的需求具有重要意义,其自身需求的指引决定英伟达业绩预期的上限。
北美四云对
Capex预算乐观,坚定发力人工智能,英伟达预期业绩依旧乐观:
微软预计2024年持续扩大人工智能的投资规模与产能,环比大幅增长,谷歌预计2024年剩下季度保持不低于120亿美元资本支出。Meta上调Capex指引从300亿美元-350亿美元至350亿至400亿美元,预计2025年资本支出持续增加。亚马逊预计2024年整体资本支出将大幅增长。
供给端,CoWos 侧:
台积电给与AI今年乐观指引。
2024年4月18日,公司公布2024年Q1季报,
根据公司公开业绩交流会,
公司明确表明人工智能需求强劲,人工智能2024年收入占比有望达到十几个点,公司预计未来五年其收入复合增长率将达到50%,2028年有望占比20%以上。我们认为此指引背后寓意为公司对于CoWos产能持乐观态度,我们判断CoWos产能的乐观,为英伟达的产品的及时出货提供乐观预期,同时根据C114消息,2024年4月18日,台积电扩产嘉义先进封装 将投5000亿元新台币建六座厂。
HBM 侧:
2024年4月25日,公司公布2024年Q1季报,
根据公司一季度交流会,
2024年公司表示采用1b纳米工艺生产HBM3e,保持领先HBM市场的领先优势,同时计划与去年相比提高的产能来扩展公司的客户群,同时公司宣布将投资约5.3万亿韩元决定将韩国清州的M15X厂定为DRAM生产基地并加速建设,我们认为HBM的产能乐观同样为英伟达的产品的及时出货提供乐观预期。
不断上调的GB200的预期:无论是今年Csp厂商的Capex指引还是HBM厂商和CoWos厂商的预期依旧充分,因此如果在明年预期上述条件依旧乐观的预期情况下,GB200的出货量预期在不断上调。
根据Semianylasis的测算:对于大模型的训练,
GB200 的性能提升约为 3.5 倍,而 B100 的提升较小,仅比 H100 高 1.5 倍。对于小模型,B100、B200 和 GB200 之间的性能提升基本上与 FLOPS 差异一致,范围从约 2 倍到 3 倍不等。
在像
GPT-4 这样的大模型中,B200 在 GPT-4 推理中带来约 4 倍到 7 倍的性能提升,当量化公平设置时,具体取决于选择的交互性曲线点。相比之下,GB200 的提升范围从约 5 倍到 21 倍——更大的提升。在模型生成方面落后于大公司的人
有望购买
GB200 用于他们的大模型训练和推理。
因此,在万亿参数
AIGC的大背景下,GB200的出货预期指引依旧乐观,同样也佐证了我们的观点。
1、抓住核心供应链变化,把握弹性:1、供应链份额的变动,例如OEM份额的提升;2、新进入供应链体系厂商,例如铜链接、液冷、电源等。
作
者
具
有
中
国
证
券
业
协
会
授
予
的
证
券
投
资
咨
询
执
业
资
格
或
相
当
的
专
业
胜
任
能
力
,
保
证
报
告
所
采
用
的
数
据
均
来
自
合
规
渠
道
,
分
析
逻
辑
基
于
作
者
的
职
业
理
解
,
通
过
合
理
判
断
并
得
出
结
论
,
力
求
客
观
、
公
正
,
结
论
不
受
任
何
第
三
方
的
授
意
、
影
响
,
特
此
声
明
。
华
西
证
券
股
份
有
限
公
司
(
以
下
简
称
“
本
公
司
”
)
具
备
证
券
投
资
咨
询
业
务
资
格
。
本
报
告
仅
供
本
公
司
签
约
客
户
使
用
。
本
公
司
不
会
因
接
收
人
收
到
或
者
经
由
其
他
渠
道
转
发
收
到
本
报
告
而
直
接
视
其
为
本
公
司
客
户
。
本
报
告
基
于
本
公
司
研
究
所
及
其
研
究
人
员
认
为
的
已
经
公
开
的
资
料
或
者
研
究
人
员
的
实
地
调
研
资
料
,
但
本
公
司
对
该
等
信
息
的
准
确
性
、
完
整
性
或
可
靠
性
不
作
任
何
保
证
。
本
报
告
所
载
资
料
、
意
见
以
及
推
测
仅
于
本
报
告
发
布
当
日
的
判
断
,
且
这
种
判
断
受
到
研
究
方
法
、
研
究
依
据
等
多
方
面
的
制
约
。
在
不
同
时
期
,
本
公
司
可
发
出
与
本
报
告
所
载
资
料
、
意
见
及
预
测
不
一
致
的
报
告
。
本
公
司
不
保
证
本
报
告
所
含
信
息
始
终
保
持
在
最
新
状
态
。
同
时
,
本
公
司
对
本
报
告
所
含
信
息
可
在
不
发
出
通
知
的
情
形
下
做
出
修
改
,
投
资
者
需
自
行
关
注
相
应
更
新
或
修
改
。
在
任
何
情
况
下
,
本
报
告
仅
提
供
给
签
约
客
户
参
考
使
用
,
任
何
信
息
或
所
表
述
的
意
见
绝
不
构
成
对
任
何
人
的
投
资
建
议
。
市
场
有
风
险
,
投
资
需
谨
慎
。
投
资
者
不
应
将
本
报
告
视
为
做
出
投
资
决
策
的
惟
一
参
考
因
素
,
亦
不
应
认
为
本
报
告
可
以
取
代
自
己
的
判
断
。
在
任
何
情
况
下
,
本
报
告
均
未
考
虑
到
个
别
客
户
的
特
殊
投
资
目
标
、
财
务
状
况
或
需
求
,
不
能
作
为
客
户
进
行
客
户
买
卖
、
认
购
证
券
或
者
其
他
金
融
工
具
的
保
证
或
邀
请
。
在
任
何
情
况
下
,
本
公
司
、
本
公
司
员
工
或
者
其
他
关
联
方
均
不
承
诺
投
资
者
一
定
获
利
,
不
与
投
资
者
分
享
投
资
收
益
,
也
不
对
任
何
人
因
使
用
本
报
告
而
导
致
的
任
何
可
能
损
失
负
有
任
何
责
任
。
投
资
者
因
使
用
本
公
司
研
究
报
告
做
出
的
任
何
投
资
决
策
均
是
独
立
行
为
,
与
本
公
司
、
本
公
司
员
工
及
其
他
关
联
方
无
关
。
本
公
司
建
立
起
信
息
隔
离
墙
制
度
、
跨
墙
制
度
来
规
范
管
理
跨
部
门
、
跨
关
联
机
构
之
间
的
信
息
流
动
。
务
请
投
资
者
注
意
,
在
法
律
许
可
的
前
提
下
,
本
公
司
及
其
所
属
关
联
机
构
可
能
会
持
有
报
告
中
提
到
的
公
司
所
发
行
的
证
券
或
期
权
并
进
行
证
券
或
期
权
交
易
,
也
可
能
为
这
些
公
司
提
供
或
者
争
取
提
供
投
资
银
行
、
财
务
顾
问
或
者
金
融
产
品
等
相
关
服
务
。
在
法
律
许
可
的
前
提
下
,
本
公
司
的
董
事
、
高
级
职
员
或
员
工
可
能
担
任
本
报
告
所
提
到
的
公
司
的
董
事
。
本
公
司
及
其
所
属
关
联
机
构
或
个
人
可
能
在
本
报
告
公
开
发
布
之
前
已
经
使
用
或
了
解
其
中
的
信
息
。
所
有
报
告
版
权
均
归
本
公
司
所
有
。
未
经
本
公
司
事
先
书
面
授
权
,
任
何
机
构
或
个
人
不
得
以
任
何
形
式
复
制
、
转
发
或
公
开
传
播
本
报
告
的
全
部
或
部
分
内
容
,
如
需
引
用
、
刊
发
或
转
载
本
报
告
,
需
注
明
出
处
为
华
西
证
券
研
究
所
,
且
不
得
对
本
报
告
进
行
任
何
有
悖
原
意
的
引
用
、
删
节
和
修
改
。
注
:
文
中
报
告
节
选
自
华
西
证
券
研
究
所
已
公
开
发
布
研
究
报
告
,
具
体
报
告
内
容
及
相
关
风
险
提
示
等
详
见
完
整
版
报
告
。
分
析
师
执
业
编
号
:
S
1
1
2
0
5
2
0
0
2
0
0
0
2
分
析
师
执
业
编
号
:
S1120524060001
证
券
研
究
报
告
:
《【华西计算机】行业跟踪 | 英伟达宣布AI主权,不断上调的GB200 预期
》
报
告
发
布
日
期
:
2
0
24
年7
月10
日
《
证
券
期
货
投
资
者
适
当
性
管
理
办
法
》
于
2
0
1
7
年
7
月
1
日
起
正
式
实
施
。
通
过
本
订
阅
号
发
布
的
观
点
和
信
息
仅
面
向
华
西
证
券
的
专
业
投
资
机
构
客
户
。
若
您
并
非
华
西
证
券
客
户
中
的
专
业
投
资
机
构
客
户
,
为
控
制
风
险
,
请
取
消
订
阅
、
接
收
或
使
用
本
订
阅
号
中
的
任
何
信
息
。
因
本
订
阅
号
受
限
于
访
问
权
限
设
置
,
若
给
您
造
成
不
便
,
敬
请
谅
解
。
市
场
有
风
险
,
投
资
需
谨
慎
。
本
订
阅
号
为
华
西
证
券
计
算
机
团
队
设
立
及
运
营
。
本
订
阅
号
不
是
华
西
证
券
研
究
报
告
的
发
布
平
台
。
本
订
阅
号
所
载
的
信
息
仅
面
向
华
西
证
券
的
专
业
投
资
机
构
客
户
,
仅
供
在
新
媒
体
背
景
下
研
究
观
点
的
及
时
交
流
。
本
订
阅
号
所
载
的
信
息
均
摘
编
自
华
西
证
券
研
究
所
已
经
发
布
的
研
究
报
告
或
者
是
对
已
发
布
报
告
的
后
续
解
读
,
若
因
对
报
告
的
摘
编
而
产
生
歧
义
,
应
以
报
告
发
布
当
日
的
完
整
内
容
为
准
。
在
任
何
情
况
下
,
本
订
阅
号
所
推
送
信
息
或
所
表
述
的
意
见
并
不
构
成
对
任
何
人
的
投
资
建
议
。
华
西
证
券
及
华
西
证
券
研
究
所
也
不
对
任
何
人
因
为
使
用
本
订
阅
号
信
息
所
引
致
的
任
何
损
失
负
任
何
责
任
。
本
订
阅
号
及
其
推
送
内
容
的
版
权
归
华
西
证
券
所
有
,
华
西
证
券
对
本
订
阅
号
及
推
送
内
容
保
留
一
切
法
律
权
利
。
未
经
华
西
证
券
事
先
书
面
许
可
,
任
何
机
构
或
个
人
不
得
以
任
何
形
式
翻
版
、
复
制
、
刊
登
、
转
载
和
引
用
,
否
则
由
此
造
成
的
一
切
不
良
后
果
及
法
律
责
任
由
私
自
翻
版
、
复
制
、
刊
登
、
转
载
和
引
用
者
承
担
。