主要观点总结
文章主要讨论了美股下跌的原因,特别是与DS成本下降和行业认知重塑有关的问题。文章还涉及DS降本的方式,主要是工程优化,以及行业常态下的模仿和组合也具备技术含量。同时,本轮最大的原创创新是GRPO技术,可免去SFT环节,降低对标注数据的依赖。关于投资影响方面,文章提出了一些想法和建议,包括AI平权、头部厂商算力投入、产业链价值转移以及算力层的降本等。
关键观点总结
关键观点1: 美股下跌的原因不仅仅是DS成本的明确下降,更多的是对行业认知的重塑。
过去OAI的超额利润来自于模型能力,但现在DS可以在短时间内复现头部模型能力,威胁了英伟达获得超额利润的根基。
关键观点2: DS降本主要依靠工程优化。
DS的技术创新并不突出,更多的是通过工程化的方式来降低成本。例如MoE架构一次性预测多个token降成本。
关键观点3: GRPO技术的原创创新。
本轮最大的原创创新是GRPO技术,它能免去SFT环节,降低对标注数据的依赖,增强推理效果。
关键观点4: 投资影响方面的观点。
文章提出AI平权是开源对闭源的挑战,可能会改变OAI和英伟达链的霸权。同时,头部厂商的算力投入不会受太大影响,但中腰部公司的算力投入可能有所下降。产业链价值未来会从算力到应用过渡,优选有场景定价权的公司以及基于GPT跑通了的应用公司。
正文
1)美股跌了这么多不完全是因为DS成本的明确下降,而是对行业认知的重塑。过去OAI这样的头部厂商的超额利润是来自于模型能力,而模型能力是依靠Capex和先发优势堆出来的。但现在如果DS可以在短时间内复现头部模型能力,这就把OAI的超额利润打掉了,也因此威胁了英伟达获得超额利润的根基。大家可以简单理解,如果直接使用开源的DS就可以达成不错的效果,那为什么需要再花大钱买卡训练模型?这也是美股英伟达跌的多的原因。
2)DS降本主要还是依靠工程的优化。DS其实技术上没有特别突出的创新,还是依靠工程化的降本比较重要。比如DS的MoE架构是利用了共享专家、均衡函数、MTP机制一次性预测多个token降成本,达成可以接受的效果。但这样的事情是行业的常态,过去的KIMI和Sora其实也大多是基于现有技术的工程优化完成了一步步的进化。我们要知道其实模仿和组合也具备很高的技术含量。本轮最大的原创创新应该是用GRPO免去SFT这个环节,大幅降低了对标注数据的依赖,也增强了推理效果。
3)关于投资的影响,一些想法有待验证:
a)一是AI平权,是开源对闭源的挑战,可能会抹平OAI和英伟达链的霸权,这也是海外演绎最核心的逻辑,推荐【阿里】、小米
b)头部厂商的算力投入不会有太大的影响,未来中腰部比如苹果、亚马逊等公司算力投入可能会有所下降。
c)产业链价值未来会从算力到应用渡让,应用肯定是最重要的方向,但是在应用的选择上要优选有场景定价权的公司。另外就是一些在海外已经基于GPT跑通了的应用公司,关注端侧、ai agent
d)算力层:降本是核心,产业链最核心的环节是云及配套,其次关注新的推理技术方案+配套供应链,关注asic+aec