专栏名称: 水木纪要
最有效、最及时分享公私募、公司、行业等投研纪要和市场热点分析。掌握市场信息差,掌握财富代码。
目录
相关文章推荐
英国大家谈  ·  视频号平台开放广告投放啦! ·  昨天  
英国那些事儿  ·  欧洲建水坝拖延7年没开工!结果河狸2天建好, ... ·  5 天前  
51好读  ›  专栏  ›  水木纪要

光模块的鬼故事,闪崩!

水木纪要  · 公众号  ·  · 2024-03-26 23:35

正文

更多一手调研纪要和研报数据,点击上面图片小程序

光模块板块今日一度快速下跌,下跌表现发酵后,市场核心讨论有几点:

1、宁德时代抢了xys的订单,3.30基金调仓筹码因素大家都懂;季度末资金调仓我们认为不具有这么大的冲击力。


2、 华为进军光模块申请光模块的专利,担心对行业格局产生重大影响,但是业内人都知道:(1)华为本来就一直在做;(2)给华为供光模块没利润;(3)华为不太可能给北美大厂供货数通光模块。

3、 "光学噩梦"言论?

原文表义是,Quantum-X800系列交换机性能大幅提升后,胖树架构下2层X800交换机可支持集群数增加。我们这里先不讨论GB200层是使用800G还是1.6T,都假设为后者(2个800G和1个1.6T对光模块厂商的影响差别不那么大)。

文章提出的观点其实核心影响的是2048-10368个GPU之间的集群的组网层数——原先用64个400G端口的QM97交换机组网时,2层交换机最多连2048卡,现在用144个端口的X800交换机组网,2层交换机可以连接10368卡。

【影响有限,结果仍高于大部分市场预期】

大部分机构对1.6T光模块的测算,原本大多是按照2x-2.5x于B GPU的比例,考虑到这层影响,我们按照1:2的极限假设做对比测算。假设2025年B系列出货量250万片,H系列出货量为180万片,TPU等出货量150万片。则:

1)按照【1:2.5】的比例关系测算,25年AI芯片对应需求约为400万只1.6T+950万只800G

2)按照【1:2】的比例关系测算,25年AI芯片对应需求约为320万只1.6T+900万只800G

市场此前对B GPU明年需求量的潜在上修,并未在光模块板块演绎,因此即使在情景2)中,我们认为测算出的市场需求,仍比多数预期更积极。


【关于 semianalysis 文章


semianalysis发布的文章“Nvidia's Optical Boogeyman-NVL72, Infiniband Scale Out, 800G & 1.6T Ramp”,光学噩梦(optical Booyerman)之论今日得到市场广泛关注。我们认为其中有两方面值得商榷:


semianalysis观点1:semianalysis讨论的出发点与市场前期的一致观点不同,其认为NVL72内部的确是72颗GPU的NVLink全互联,但不同NVL72机柜间采用800Gb/s带宽的IB架构互联,在两层IB架构下,其中的B200与1.6T数量比是1:2.5。
我们认为:可能更符合真实情况且市场上周已形成的一致预期是8台NVL72组成的SuperPOD内576颗GPU实现NVLink全互联(B200与1.6T数量比是1:9),当GPU数量超过576颗时,才会在不同SuperPOD间引入普通的IB架构互联。


semianalysis观点2:在上述假设不同NVL72机柜间使用IB架构基础上,semianalysis类比H100组网和NVL72组网,1)当GPU数量不大时,两者都使用两层IB架构完成组网(H100使用64端口、配备400G/s ConnectX-7网卡的Quantum-2交换机,NVL72使用最新一代144端口、配备800G/s ConnectX-8网卡的Quantum-800交换机),2)而当GPU数量较大,如9216颗时,64端口的Quantum-2交换机需要3层IB架构组网,H100:800G关系将从1:2.5到1:3.5,而144端口的Quantum-800G交换机仍只需要两层组网,B100:1.6T仍为2.5,因此比例关系的差异意味着少用光模块,迎来“光学噩梦”。

我们认为,首先,基本不需要用三层IB架构去实现9000多颗GPU芯片的组网(superPOD内的GPU是NVLINK全互联非IB架构互联,且未来superPOD的规模会进一步变大),而在两层IB架构下,1:2.5的关系一直是不变的。其次,伴随光模块的不断升级,如800G→1.6T,光模块单价也有明显增加。因此,我们认为“光学噩梦”偏无稽之谈。


【关于 QuantumX800

新款QuantumX800交换能力或大幅提升,但不会明显影响光模快的确定性
1、新的Quantum-X800交换机单机交换能力大幅提升,具有72*1.6T OSFP端口,115Tbps带宽,这是因为它内部用了4颗交换芯片(交换寻址能力视作一颗,这是核心技术)
2、交换机单机带宽越大带的端口就越多,同等节点规模下需要的交换机就越少,semi认为在9216个GPU节点,QuantumX800仍然能用2层交换网络,而此前的QM9700必须3层了






请到「今天看啥」查看全文