专栏名称: 信息平权
理性 客观 朴素
目录
相关文章推荐
学习强国  ·  警方建议:关闭手机这项功能! ·  4 天前  
学习强国  ·  警方建议:关闭手机这项功能! ·  4 天前  
财联社  ·  苹果斥资15亿美元加码卫星通讯 ·  5 天前  
财联社  ·  苹果斥资15亿美元加码卫星通讯 ·  5 天前  
创伙伴  ·  新首富张一鸣,“隐身”1200天 ·  6 天前  
投中网  ·  杭州超级LP,操刀百亿大交易 ·  6 天前  
投中网  ·  杭州超级LP,操刀百亿大交易 ·  6 天前  
51好读  ›  专栏  ›  信息平权

两天涨40%的票,多还是空?

信息平权  · 公众号  · 科技投资 科技自媒体  · 2024-11-07 20:04

正文

(以下内容不构成投资建议,仅供参考。多头/空头均可参考)

Astera Labs一直是多空双方激烈博弈的一只票:空头看衰其PCIe retimers在英伟达GB200中的用量减少(vs. DGX);多头则看好其最新推出的PCIe switch将帮助公司大幅提升价值量。今天,先来详细拆解一下Astera Labs在英伟达AI服务器中的价值含量。(不想看技术的,可以跳到最后看结论数字$)

首先,英伟达目前的DGX server中到底用了多少颗PCIe retimers和switches?我们知道,一个DGX server里有一张UBB(universal base board)板,上面放了8颗GPGPU,另外还有一个CPU board (被称为head node),上面放了2颗CPU。笔者根据供应链调研得知,一个标准的DGX server里会在UBB板上配置8颗PCIe Gen5 retimers (对应8颗GPGPU),以及在head node上配置8颗PCIe Gen5 retimers,对应UBB上的8颗retimers(有些MGX客户也会通过改动板子的Layout来缩短数据传输距离,从而实现在head node上只放置4颗retimers,但标准版的DGX里是8+8 retimers的设计)。此外,一个DGX server里还配有2颗144 lane的PCIe Gen5 switch,用于连接CPU,GPU,以及CX7网卡。具体来说,每颗PCIe switch要连接1颗Intel或AMD的CPU,占用16 x 2 = 32 lanes;2张CX7网卡,占用16 x 2 = 32 lanes;以及4张GPGPU卡,占用16 x 4 = 64 lanes,总共占用了128 lanes,剩下的144 – 128 = 16 lanes英伟达没有规定配置,留给客户和整机厂家自由发挥(见下图,以AMD CPU DGX为例):

这其中,PCIe Gen5 retimers英伟达采用的是Astera Labs,一颗的量产价格在$30~35(取决于客户要的量多少);PCIe Gen5 switch则采用的是博通的PEX89144,一颗的量产价格在$400~450。
讲完了DGX server, 下面让我们来看一下英伟达GB200 compute tray的PCIe拓扑结构图:

这里大家可能有一个理解的误区:自从Astera Labs在OCP大会宣布其Scorpio PCIe Gen6 switch产品会用在GB200之后,有一些投资人误以为上图中蓝色的PCIe fanout switch即是这颗用在GB200里的PCIe switch。其实这只是一个PCIe Gen3 switch(16个uplink接Grace CPU + 18个downlink接USB/BMC/Boot/Debug network),用于管理compute tray里面的一些miscellaneous/peripherals设备,由美国analog芯片公司Diodes供应。英伟达标准版的GB200 reference design里面是没有PCIe Gen6 switch的,而只有采用非英伟达CX8网卡和/或采用非英伟达Grace CPU的hyperscalers客户才需要在GB200 compute tray里加装PCIe Gen6 switch。

我们知道,Astera Labs今年首先推出的是一款64 lane的PCIe Gen6 switch,用于连接compute tray里面的CPU/GPU/NIC/NVMe。笔者根据供应链调研得知,一张GB200卡需要对应使用2颗Astera Labs的64 lane PCIe switch,其中每颗PCIe switch要连接1颗CPU,占用17 lanes;1张NIC网卡,占用16 lanes;1张GPGPU卡,占用16 lanes;以及2个SSD(即NVMe),占用2 x 4 = 8 lanes,总共占用了57 lanes,剩下的64 – 57 = 7 lanes暂时闲置,不同客户可以根据自己需要自行配置(见下图):

一个GB200的compute tray有两张GB200卡,因此需要配置2 x 2 = 4颗这样的64 lane PCIe switch此外,虽然标准版的GB200 compute tray因为CPU和GPU距离很近且是通过NVLink C2C连接,因此不需要再使用PCIe retimer,但如果hyperscalers客户采用based on FPGA的自研的NIC网卡,且NIC和NVMe是放在另外一块主板之外的extended board上的话,那就仍然会需要采用4颗PCIe retimers(对应4张NIC网卡)。

基于以上DGX和GB200的PCIe拓扑结构,我们可以来测算GB200中的价值量了,以及介绍Astera Labs目前拿到的GB200项目客户是谁。

如前文所说,Astera Labs在英伟达DGX server中的价值量大致为$30~35 ASP x 16 PCIe Gen5 retimers  = $480~560 per compute tray,or $60~70 per GPU。如果单从retimer的角度来看的话,Astera Labs在GB200的content dollar的确会大幅下降:$45~50 ASP x 4 PCIe Gen6 retimers = $180~200 per compute tray,or每GPU$45~50

这里需要注意的是,虽然GB200中PCIe retimer的使用量减少了很多,但因为PCIe Gen6 retimer与PCIe Gen5 retimer相比技术上有着显著提升,因此ASP将会有~50%的提高

但这只是计算了DGX vs. GB200里面PCIe retimer的content。当我们把公司Scorpio PCIe Gen6 switch产品加入进去,就会发现Astera Labs在GB200中的价值量其实是大幅增加的:目前PCIe Gen6 switch芯片仍然在sampling阶段,所以还不知道确切的量产价格,但笔者大致推算一颗64 lane 的PCIe Gen6 switch价格应该在$200~250之间。一个GB200 compute tray里面需要用4颗。再加上4颗PCIe Gen6 retimers,则Astera Labs在英伟达GB200 中的content dollar大致为$1000~1200 per compute tray,或者每GPU $250~300

公司的Scorpio PCIe Gen6 switch目前已经进入了AWS和Google的客制化GB200 rack(即compute tray中采用自研的NIC而非英伟达的CX网卡)。具体拿到多少订单?在台积电的投片明年增长多少?从台积朋友那里问到一些可靠的排产数字(发在星球了)只能说按照上述推演算估值的话,的确还是贵...但产业群有个做互芯片的创业大佬称赞这家公司产品力很强,且后续还有很多产品线,长期非常看好。总之分歧是越来越大,欢迎来星球继续讨论

欢迎去订阅AYZ的Substack: https://substack.com/home/post/p-151279063