最近,媒体谈到了微软 (Mark Murphy 报道) 在 2025 年大幅削减 GB200 机架订单,并将部分需求转移到 GB300。在本报告中,我们概述了上游和下游食品链的观点。总体而言,这与我们之前的报告相呼应,即 GB200 下游增长将比预期慢,但我们认为 Blackwell 的上游出货量不太可能发生变化 (2025 年约为 500 万台)。这可能会对鸿海和液体冷却供应商产生增量负面影响。
上游仍计划在 2025 年实现约 500 万台 Blackwell 出货量:我们的研究表明,上游供应链仍计划在 2025 年实现约 500 万台 Blackwell 出货量(而下游研究估计 Blackwell GPU 出货量约为 450-500 万台,这是由于 AI 服务器出货量和供应链中台积电芯片出货量的交货时间存在差异),供应量在 2024 年第四季度开始增加(15-20 万台),并在 2025 年第二季度达到 60-80 万台。在 500 万台中,我们假设 250 万台将分配给 GB200/GB300 配置,尽管上游供应链更加灵活(因为 Grace CPU 出货量实际上不受 CoWoS 封装容量的限制)。在上游供应链中,唯一的制约因素似乎是网络芯片,大多数初始 Blackwell 设备仍随附 ConnectX-7,而支持 800G 网络的 ConnectX-8 仅在 2H25 可用(我们初步认为可能与 GB300 的增长时间相符)。
上游供应问题
#1:台积电 CoWoS-L 产量存在一些问题,但基本可以控制:经过 Blackwell 设计修改后,我们认为 GB200 的 CoWoS-L 相关产量现在要好得多。我们的研究仍然表明 LSI 或硅桥存在一些问题,因为台积电需要为每个 B200 生产两个完全相同的硅桥。CoWoS L 制造工艺的其他领域已经接近 CoWoS-S 产量,这表明供应问题应该基本可以控制。
#2:除非三星迅速获得资格,否则 HBM 可能会吃紧:NVDA(由 Harlan Sur 报道)可能会依赖 HBM3e 12Hi 和 8Hi 的混合来打造其 Blackwell 系列,鉴于对推理应用的需求更高,以及 GB300 可能会随着 HBM 内容的升级而增加,2H25 可能会优先选择 12Hi。目前,SK Hynix 是这两种产品的最大供应商,不太可能独自满足 2025 年的需求。因此,三星的 HBM3e 认证和顺利的出货进度非常重要,一旦 GB300 产能提升,任何产能提升延迟都可能成为 2H25 的制约因素。
#3:PMIC 变化使供应链措手不及:GB200 在过去 1 个月内也经历了 PMIC 设计和 PMIC 供应商的最后一刻变化。这有助于解决供应链面临的一些挥之不去的配电问题,但 PMIC 食物链中的新供应商可能还没有完全准备好在 2025 年供应 NVDA 所要求的数量。最初,这可能是一个小问题,但我们认为,鉴于足够的产能可用性和更短的周转时间,这不会成为 2025 年的一大障碍。
ODMs:下游供应商的风险更大:我们强调了 GB200 上游组件供应商和下游 ODM 出货量之间的差距,原因是 GB200 服务器组件可能不匹配,而且新产品的生产周期较长。GB200 是一款全新的产品,我们认为可能需要几个月的时间才能微调固件。因此,我们认为 ODM 可能很难在产品周期的早期满足终端客户供应商的高订单预期,但这更多的是供应限制,而不是需求问题。我们需要监测 CSP 是否会将支出重新分配给 Hopper、Blackwell HGX 或将其推迟到 2H25。目前,我们预测 2025 年 GB200 NVL 72 机架级出货量为 25k(而整个周期之前为 34k)(见表 1),鸿海和广达占据 80% 的市场份额。对于鸿海而言,除非供应链产品在 2025 年下半年赶上进度,否则这可能会导致 2025 年机架级出货量减少 2000 台(或与 JPM 之前的预测相比,总收入减少 2-3%)。对于广达而言,鉴于其在现有的基于 H200 和基于 HGX 的 Blackwell 型号中为 CSP 供应商提供了强大的存在感,我们预计其影响会更加均衡。值得注意的是,GB300 服务器的规格升级意义重大,因此 GB200 的缓慢增长意味着后续型号的增长可能会延迟。
#1:GPU 基板生产与芯片产量之间的差距可能持续存在:我们的研究表明,Blackwell GPU 芯片产量在 2025 年第一季度可能达到 40 万片,而基板出货量则要低得多,原因是板级良率不理想以及 PMIC 供应紧张。因此,我们假设 2025 年第一季度 GB200 NVL 72 机架出货量仅为约 2-3k。
#2:安费诺盒式磁带出货量缓慢上升:我们的研究表明,考虑到技术难度和产品性能的持续优化,安费诺的电缆盒式磁带出货量在 2025 年第一季度正在缓慢上升。这可能会导致 GPU 产量和系统产量之间潜在的不匹配。我们预计安费诺的内容机会或市场份额在短期内不会发生任何变化。
#3:由于 CCL/PCB 问题,NVSwitch 板进入 M/P 周期较晚:GB200 将采用高层数 HDI(18-22 金属层)用于计算和 NVLink 交换托盘主板,尽管之前曾有传言称交换板将使用 PCB。由于超大面板尺寸的技术挑战,目前的生产量仍然有限,但计算托盘板的产量将在 12 月及以后上升。同时,由于最后一刻的设计变更的严重影响,我们认为交换托盘产量在第一季度的大部分时间里可能会保持低位。然而,我们相信一旦开始批量生产,电路板级别的产量将开始攀升。因此,虽然确实有一些关于 GB300 采用 PCB 的讨论,但我们认为最终决定还要几个月才会出现。
#4:液体冷却似乎已步入正轨:我们目前没有看到液体冷却组件(如冷板、歧管、UQD 和风扇)出现瓶颈。目前量产计划仍处于PVT(生产验证和测试)阶段,预计将于1Q25进行量产。