正文
最近,许多投资者对NVDABlackwell供应链延迟问题提出了疑问。我们的研究表明,这里存在一些问题,包括B100/B200芯片和封装(CoWoS-L)层面的挑战,以及电路板设计和系统层面的持续问题。目前,芯片层面的问题似乎是瓶颈。总体来看,我们预计B100的出货会因Blackwell迁移到B200A而延迟一个季度。GB200的采样计划基本保持不变,但供应在最初几个月可能会严重受限,批量生产可能要到2025年第一季度才能开始。同时,随着客户延长对Hopper架构的购买,我们看到基于H200的系统有上行空间。从现在开始,关键要关注的是客户在应对Blackwell进度放缓时,GB200的组合是否会在2025年发生重大变化。
我们认为B100/B200N4芯片(GB100芯片)存在一些挑战,主要是要找到两个性能非常高(高等级速度分档)且功率阈值相同的芯片以放入B200CoWoS封装中。这可能需要稍微降低产品的性能阈值。
然而,我们的检查并未表明有任何严重到需要重大重新设计或多季度延迟的问题。
此外,CoWoS-L的良率仍然不高且不稳定(我们认为目前只有~60%的水平,远低于CoWoS-S的90+%水平),这是由于RDL基互连/LSI制造的良率较低。CoWoS-L工艺在基板级别有一层用于散热的石墨膜,但一些材料变形问题也导致了一些良率损失。
GB100和GB102是GPU芯片的代码名称,其中GB102是较低等级的芯片,与GB200NVL机架级解决方案不同。
我们认为TSMC正在为这些问题进行多项修复。芯片层面的影响
B100可能被B200A取代。
首先,我们的供应链研究让我们相信Blackwell系列的低端(B100)可能会被B200A取代(即使用一个较低速度的GB102GPU芯片,而不是两个GB100芯片,并且使用4个HBM芯片而不是8个)。
B200A可能会使用12HiHBM3e来达到144GB的HBM密度,相比之前的192GB,因此价格可能会更低。
B200A也可能会迁移回CoWoS-S(而不是CoWoS-L)以管理良率问题(HBM封装的占地面积应该更小),并且主要为GB200产品释放CoWoS-L产能。我们认为B200A可能在2025年第一季度向客户发货,比预期晚了一个季度。由于这一转变,我们预计未来2-3个季度CoWoS-S需求将增加50-60k片晶圆。
GB200在2024年下半年的增长较慢;
其次,我们认为GB200超级芯片在2024年第四季度(用于上游出货)仍可能增加,即使CoWoS-L的良率挑战可能会限制总出货量。总体而言,我们认为2024年Blackwell在上游的出货量应该达到40-50万片(低于之前的60万+单位)。GB200供应可能在2024年底和2025年第一季度初仍然相当紧张,然后随着更多CoWoS-L产能上线和良率逐步提高而显著扩大。同时,我们认为H200在2024年下半年有一些增长(额外需求高达50-60万),因为AI服务器客户继续看到整体AI计算需求的增长,并将在至少另一个季度保持Hopper架构。
到目前为止,我们还没有看到任何可能完全破坏2025年上半年Blackwell出货的关键问题,一些最近的修复也旨在解决芯片和封装层面的问题。总体上,我们仍然预计2025年Blackwell相关的GPU出货量将达到450万+单位,尽管初期良率存在挑战,但大部分产量仍将保持在CoWoS-L上。
我们一直在强调潜在的过热和固件兼容性问题(链接)。我们认为Nvidia一直在进一步优化GB200超级芯片的性能,导致MLCC配置和可能的PCB布局变更。虽然这种设计变更意味着更长的NPI过程,但我们认为这不会导致进度的重大推迟。在最坏的情况下,放宽一些设计参数可以克服一些挑战。然而,较慢的上游产量增长仍可能导致下游出货延迟。虽然终端客户(超大规模企业/企业品牌)将在8月收到GB200超级芯片板的样品,但我们认为ODM的有意义的增长将推迟到2025年1月(比之前的预期延迟约3个月)。除了Bianca板的延迟外,我们还看到系统中液冷安装的担忧增加,原因是潜在的水泄漏问题和组件供应紧张(特别是UQD)。
我们认为B100芯片的出货可能会由于更改为B200A而推迟一个季度,可能只在2025年第一季度出现。对于GB200,芯片层面的限制因素是CoWoS-L的良率,因此我们预计2024年下半年上游芯片出货量只能达到40-50万片(相比之前的60万+)。对于GB200超级芯片板,仍然存在供应链挑战,因此GB200NVL机架出货量在2024年第四季度可能非常有限,批量增长仅在2025年第一季度。H200需求上升,GB200计划到2025年保持不变。
与此同时,基于H200的系统在2024年下半年需求显著增加(高达50-60万GPU单元)。展望2025年,我们在上游供应链中看不到Blackwell采用趋势的重大变化,总量仍占NVDAGPU单元总量的~80%(450万+单位),并且2025年TSMC的CoWoS-L分配仍然主要倾向于NVDA,没有最近的变化。对于GB200超级芯片,我们认为2025年Blackwell出货量中~50%的份额应使用超级芯片配置,尽管增速可能推迟到2025年第一季度。
Blackwell产品组合的变化–GB200vsHGX
我们认为Nvidia在2024年下半年一直在向超大规模企业和企业推广H200服务器,产品生命周期可能会持续到2025年上半年。因此,我们可能在2024年第三季度到2025年第一季度看到更高比例的H200出货量。展望Blackwell代,我们认为Nvidia将优先向超大规模企业提供GB200服务器,而企业品牌可能会获得GB200AUltra服务器。如果GB200NVL36/72产品无法按计划增加,我们预计超大规模企业将更多地采用HGXB200A和GB200AUltra。如果发生这种情况,我们认为这对鸿海来说是负面的,对广达中性,而对纬创是正面的。这对液冷供应链来说也可能是负面的。在我们看来,这仍然相当早期,供应链和NVDA仍致力于推动向GB200机架级架构的一致转变。
对于TSMC,我们没有看到估计的重大变化,因为B100的推迟可能会被2024年下半年H200数量增加所抵消。我们还认为,即使存在这些良率问题,2025年CoWoS-L的采用也不太可能改变,Blackwell、
BlackwellUltra和Rubin家族的大部分产品仍计划使用CoWoS-L。NVDA最近对CoWoS-S需求的增加
(用于B200A和H200的上升)可能会使CoWoS-S的供应情况更加紧张,可能会导致ASE和Amkor的部分需求溢出。对于ASMPT来说,CoWoS-L的增速较慢和良率问题在短期内会对市场情绪产生负面影响,但产能增长没有变化,甚至可能加速以弥补低于预期的良率。对于欣兴来说,Blackwell和GB200的增速较慢可能会导致AI相关收入的确认推迟。对于HBM食品链来说,B200A可能会加速12HiHBM3e的采用,时间表的变化似乎不会对HBM内容产生任何有意义的变化。