专栏名称: 信息平权
理性 客观 朴素
目录
相关文章推荐
21ic电子网  ·  巧夺天工的kfifo竟然把MCU搞挂了? ·  2 天前  
21ic电子网  ·  一文读懂VLAN和VXLAN ·  2 天前  
爱可可-爱生活  ·  今日推介(第1585期):面向医疗挑战问题的 ... ·  4 天前  
人工智能那点事  ·  夜骑开封爆火,多条路段严重拥堵!郑州、开封两 ... ·  4 天前  
51好读  ›  专栏  ›  信息平权

制裁?送钱罢了

信息平权  · 公众号  · 半导体 AI  · 2024-11-11 20:30

正文

先说结论,AI可能是芯片国产化最大的一次机会。

1. AI是一次计算架构掀桌子的机会
之前发过季宇老师的文章,英伟达用了20年实现了GPU对CPU生态位的超越。而AI就是一次芯片生态位重新排序的机会。3月GTC和Blackwell的发布,会成为半导体历史上的里程碑事件:ARM掀了x86的桌子、不需要升级制程(都是4nm)而仅仅升级了封装工艺(CoWoS-S到CoWoS-L)、通过Nvlink带来的rack系统级提升比芯片本身更重要、甚至堆内存开始比堆计算更重要、以及竟然在某个距离尺度内发生了“铜进光退”、144端口的交换机放过去可能都找不到场景。所有这些,放3年前可能是半导体人不敢想象的。可能再过5年回头看看2024年的GTC,说不定这就是半导体天翻地覆的序幕和开端。
比如上篇文章介绍国内被倒逼出来的架构创新:访存不够,那就做大Rack,甚至尝试存算分离;制程不够,那就加码chiplet,重点搞die to die互联。
这些背后的实质是什么?AI刚刚开端,下游模型和应用,都处于剧烈变动,而处于上游的计算体系架构,完全没有定型。

2. 只看AI芯片本身,重点已经不是先进制程,而是封装
过去半导体范式下,下游对芯片的需求简单粗暴,以更低功耗实现更高Flops,访存的需求通过“memory hierarchy”层层分解降级。而AI本质上从过去“离线计算”转向“实时计算”,访存需求骤升,让单卡的重点变成“算力带宽匹配”,更大的算力靠chiplet(Blackwell 2颗到Rubin可能的4颗),更大访存带宽靠更大的HBM堆叠,因此需要更大的interposer和更大的封装尺寸。
过去追求先进制程的范式下,说实话想追赶台积电,可能一辈子也追不上...但如果是chiplet和大尺寸封装,国产成功率很高:
  • 可能除了DDR5(越来越多layer需要EUV),其他环节在设备和工艺上没有明显“硬约束”
  • 台积电最核心的“产品迭代和定价策略模型”,在先进封装上情况略有不同。比如28nm折旧结束依然可以赚10年现金流,我难以想象CoWoS还能跑5年...
  • 而cowos封装本身,其实是一个ROI不错的生意。之前文章我们介绍过,台积电有一个非共识,就是CoWoS抛掉on substrate之后的毛利率,到了明年初,会和前道晶圆相当。这对台积电是个重要信号,对国产芯片也是个重要信号,即先进封装有机会获得与先进制程一样的回报率,但初始和累计投资门槛却远低于先进制程。这就是机会。


3. 未来AI大部分需求来自推理
周末推特上热议的AGI到底是加快还是放慢了。The Information文章认为pre train放缓了,但Sam Altman周末访谈说2025年可以看到AGI,且Level4可能更快实现。总结来说,目前已经很明显了,不管pre train是否真的瓶颈了,至少OpenAI自己坚持认为test time compute也就是推理计算scaling,会让AGI更快到来。回头看看去年12月ilya也是这么认为。
而推理卡能在商业场景跑通的国产卡,远比训练要多。是否就利空英伟达了?先放一边,因为算力的总需求、最大公约数还是利好英伟达。但仅从国产芯片机会来说,推理卡胜算明显更大。比如某些大厂的自研不仅可以自用,而且算力已经对外出售了...

4. 所谓的HBM禁令是个伪命题
今天凌晨大摩“著名”存储空头shawn kim又发了看空报告(7月开始转空,过去call cycle很准)。核心观点就是DRAM期货价格会在25年Q1出现2年来第一次环比下降、2025年HBM竞争和供给会加强、中国不仅会有DDR5,且认为CXMT会在2026年超越镁光成为全球第三大DRAM厂商
先把存储是否down turn放一边,只要不是非常紧缺,所谓的“封锁禁令”就是个伪命题。周期品你懂得,commodity,但凡一点过剩的产能或库存,会以任何你想不到的方式在市场流通。之前美国封锁了这么多技术,这还是第一次去封锁“commodity”,严重怀疑其效果...(GPU都堵不住,何况一个标品)


机会摆在面前,但也现实问题:

1. 从国央企智算中心,走向中国自己的CSP+互联网客户的商业场景,谁给机会?给多大机会?
2. 何时能有接近cuda(哪怕照搬)一样的软件生态,或者至少能让下游infra的应用实践,持续积累出规模效应(这个可能很难...)
3. 英伟达、台积、微软、OAI等等建立的全球协作分工、市场驱动下的高效商业合作我们...如何能找到或者实现一样的生态效率
4. 最后一个,是问题也是机会。AI目前的阶段是硬件推着应用走,未来总有一天应用会拉着芯片走(智能机PC都经历过。当应用去定义芯片,就有降维打击、弯道超车的可能。华为和苹果就是最好的例子。但这一天不知道要等多久,毕竟AI的超级应用都还没来。
总结来说, 国产AI芯片未来10年的路,还很长、很宽。而每次制裁又是在加速国产半导体进步,5年前的实体清单可能让国产加速了10年。那么AI机遇+制裁,快乐加倍...
以上大摩存储报告、The Information文章付费完整版都在星球了。此外周末推特争议的AI到底加速还是放缓的问题,嘉宾D.S稍晚会做重点解读,期待下。