DeepSeek专家Call核心要点
JP摩根 (G. Hariharan, 25/01/28)
电话会议的主要内容:
-
DeepSeek的创新来自于多个模型优化,包括专家混合(Mixture of Experts)、模型架构(如多头潜在注意力)、FP8的使用等。DeepSeek R1似乎不是一个独立的基础模型,而是可能建立在其他开源模型(如Lambda)的开发基础上,随后在专门的数据集上进行训练,包括其他大型语言模型(LLM)的输出。
-
DeepSeek的训练成本约为600万美元并不能完全反映真实情况,因为这个成本没有考虑其他间接费用、开发其他基础模型的成本等。似乎MoE模型已经被训练并优化以应对一些关键任务,如编程和数学,这使得它在这些任务上接近甚至超过OpenAI的性能。
-
这并不代表范式的转变,而更像是LLM模型、算法和技术的持续创新。如果这些效率被广泛实现,将导致推理模型成本大幅下降,从而加速Agentic AI的发展。目前,专家认为,Agentic AI可能在2025年仍然处于炒作阶段,实际部署可能会推迟到2026年,原因在于企业对于授权和信任的需求。专家对AI模型未来的演进持乐观态度,认为我们仍处于AI发展的初期阶段,类似于互联网普及周期的1996年,而非1999年。
-
前沿模型的开发影响尚不明确。他一直认为,LLM模型可能会迅速商品化,特别是在蓬勃发展的开源生态系统中。同时,他认为大型云服务提供商(CSPs)将继续追求前沿模型,作为区别化竞争的手段,并开辟生成式AI(如视频、现实世界AI、物理AI等)新的领域。
-
AI资本支出和能源使用预算可能会保持强劲,但如果R1的效率在所有新模型中得以实现,最终可能会对这些方面进行重新思考。然而,计算需求可能依然会非常强劲,因为便宜的推理过程将推动更多AI的普及。专家认为,500美元的推理成本可能会继续下降,从而进一步推动AI的普及和应用。
-
专家认为,对于中国的限制措施大多是徒劳的,且可能会使中国的更多AI发展对外界保持隐蔽。专家认为,更多的开放合作和信息共享有利于整体AI生态系统的发展,并能避免潜在的陷阱。
DeepSeek AI模型发布的影响
高盛(A. Duval, 25/01/28)
在中国AI初创公司DeepSeek推出了一款使用较低端芯片的新型低成本开源LLM后,我们欧洲科技硬件覆盖的AI相关股票遭遇了显著的股价压力,ASML、ASMI、BESI、IFX、STM的股价分别下跌了-7%、-12%、-8%、-2%和0%。
我们注意到,目前关于该模型自称低成本的特性是否会 a) 使LLM商品化,从而降低其货币化空间(因此质疑AI模型的投资回报率),和/或 b) 对半导体计算支出施加下行压力(进而影响半导体设备需求)存在广泛讨论。另一方面,也可以认为,这种低成本可能使AI民主化(通过降低成本),从而帮助AI进一步普及,并维持强劲的支出水平。
在这方面,我们注意到,我们的美国半导体团队认为,DeepSeek所引用的成本并没有考虑到其训练模型时所使用的其他开源LLM的训练成本,这表明该成本的表面数字可能被低估。此外,如果每个模型的成本确实有所下降,他们认为这可能导致AI的更广泛普及。另外,我们的美国互联网团队不预计美国主要超大规模云服务商的支出计划会有重大变化,这对我们覆盖的更广泛的欧洲半导体设备板块来说是一个积极因素。我们将详细说明我们的覆盖范围的影响,以及与AI支出和ASML明日财报相关的关键关注点。
DeepSeek的进展是否会导致AI半导体支出减少?
我们注意到,几乎所有主要的AI半导体生态系统参与者昨天的股价都出现了负面波动,因为投资者担心,鉴于DeepSeek声称通过使用较旧版本的Nvidia GPU(以显著更低的成本)实现了更好的性能,AI应用对先进GPU的需求可能会受到影响。尽管我们承认DeepSeek在生产这些模型方面的创新,但我们认为该公司所引用的成本并未考虑到用于训练DeepSeek模型的其他开源LLM的成本(详见美国团队的说明)。
此外,我们认为,如果能够通过借鉴DeepSeek使用的一些技术来创建类似的模型(或使现有模型方法更加高效),这可能会促使AI的使用增加,从而在整体上推动AI硬件需求的增加。此外,我们强调,即使美国超大规模云服务商能够从更高效的水平中受益(鉴于其核心业务的强大自由现金流),它们仍可能继续在AI能力上保持相似的资本支出(从而推动更大的总体产出),以维持其竞争壁垒。
更广泛来看,这些低成本模型的推出可能对AI的更广泛普及和应用产生净正面影响,从而推动对尖端芯片和前端半导体设备的需求(尽管我们将在即将召开的财报电话会议中寻求更多来自各类AI相关企业,特别是超大规模云服务商的评论)。因此,我们在2025年展望报告中维持对欧洲半导体设备公司ASML、ASMI和BESI的积极看法,同时密切关注这一局势的发展。
美国超大规模云服务商会下调短期AI支出吗?
我们认为,在财报季即将开始时,投资者将关注美国超大规模云服务商关于AI基础设施支出的评论(高盛预计2025年美国超大规模云服务商支出将超过2500亿美元)。虽然DeepSeek所创建的模型确实对美国超大规模云服务商未来的支出水平提出了疑问,但我们的美国互联网团队认为,AI模型成本(即训练和推理成本)的降低可能是一个潜在的利好,因为这些节省的成本可能会转嫁给客户,从而推动AI的进一步普及。
DeepSeek的进展是否会导致AI半导体支出减少?
我们注意到,几乎所有主要的AI半导体生态系统参与者昨天的股价都出现了负面波动,因为投资者担心,鉴于DeepSeek声称通过使用较旧版本的Nvidia GPU(以显著更低的成本)实现了更好的性能,AI应用对先进GPU的需求可能会受到影响。尽管我们承认DeepSeek在生产这些模型方面的创新,但我们认为该公司所引用的成本并未考虑到用于训练DeepSeek模型的其他开源LLM的成本(详见美国团队的说明)。
此外,我们认为,如果能够通过借鉴DeepSeek使用的一些技术来创建类似的模型(或使现有模型方法更加高效),这可能会促进AI使用的增加,从而整体上推动AI硬件需求的增长。此外,我们强调,美国的超大规模云服务商可能会继续在AI能力上保持类似的资本支出(从而推动更大的整体产出),即使它们能够从更高的效率水平中获益(鉴于其核心业务强劲的自由现金流生成)
DeepSeek最新高盛交易台点评
高盛(G. Esposito FICC&Equity, 25/01/28)
广泛的结论与DeepSeek规模框架
在DeepSeek的R1推理模型(由总部位于中国的量化对冲基金High-Flyer拥有,并建立在现有开源模型基础上,如Meta的Llama和阿里巴巴的Qwen)成功进行基准测试之后,广泛的AI主题交易反应较为消极,因为围绕支出水平、支出回报及当前趋势线的可持续性(无论是过去还是未来)提出了质疑。
除了模型本身,DeepSeek还推出了一款移动应用,截至发布时该应用在美国iOS应用商店排名第一。目前市场的反应主要由以下问题驱动:AI主题扩展所需的集体资本支出(参见下图中高盛的预测),已部署的历史资本及其相对的投资回报,以及未来资本需求的节奏/周期。这些问题可能会对科技和能源行业产生压力,直到更多公司管理层在2024年第四季度财报季节中提供自己的洞察和观点。
高盛的研究继续强调,AI主题的下一阶段演变可能会从基础设施层转向应用层(以AI代理、企业用例、日益增长的消费者效用和变化的计算习惯的形式),作为驱动2025年及以后的资本回报更线性理解的下一批可识别的证据。
DeepSeek有多大?
尽管消费者AI领域持续发展(如之前的研究所述:链接 | 链接),DeepSeek的R1发布(官方发布日期:2025年1月20日 - 链接)引发了关于影响三个层面的多个话题的讨论(基础设施、AI模型/平台和应用)。DeepSeek的移动应用(由公司V3模型提供支持,于2025年1月15日发布)自发布以来,下载量激增,但该应用的使用量并未以相同的速度扩展。
半导体
GIR认为,我们目前所看到的负面反应,是在DeepSeek发布的R1技术论文背景下出现的,论文暗示有办法以大幅降低成本的方式构建有效的AI模型。尽管如此,值得注意的是以下几点:a)DeepSeek报告的训练成本为560万美元,可能并不代表开发V3的全部成本,因为它似乎利用了其他开源模型;b)关于DeepSeek的V3模型训练所依赖的基础设施仍存在不确定性(即现有出口管制对领先GPU的有效性)。
团队重点提到,Nvidia、AMD、Broadcom、Marvell、Arm和Credo Technology在计算/网络领域,Micron在内存领域,以及Applied Materials、Lam Research、KLA、Teradyne和Entegris在晶圆厂设备、测试和材料领域的公司,这些公司为AI基础设施的建设提供了支持。如果现有厂商暂停重新评估其前瞻性资本支出计划,可能会受到负面影响;如果他们决定加速发展,可能会带来正面影响。
软件
虽然人工通用智能(AGI)是许多私营软件公司追求的“北极星”,但在应用层面,对于许多企业级生成AI应用而言,99百分位的模型并非必需。DeepSeek在基础模型层引入了定价竞争,正值许多企业用例的模型已经足够好之际。进一步的模型扩展以及降低成本应有助于催化AI工作负载的更广泛使用,并推动企业和消费者的采用。
随着团队看到中小型企业(SMB)和企业IT需求环境的早期改善信号,他们对2025年AI支出的增长持乐观态度。他们认为,计算成本降低的好处将流向像MSFT、CRM、NOW、ADBE等已经有成熟AI应用的公司,同时,从长远来看,这也可能为更多新兴软件公司提供创新机会。这一切对企业中的AI应用场景都是有利的。
苹果: F1Q25前瞻
高盛(M. Ng, 25/01/23)
我们预计AAPL 2025财年第一季度的每股收益(EPS)为2.35美元(与FactSet共识一致),收入为1242亿美元(略低于共识的1248亿美元)。我们预测2025财年第一季度iPhone收入同比增长1%,因为尽管出货量同比下降4%(与IDC一致),但由于iPhone平均售价(ASP)同比增长5%,这一点足以抵消出货量的下滑。中国智能手机市场的竞争已加剧,但我们对2026财年iPhone增长加速的潜力感到鼓舞,主要得益于iPhone 17/18的新产品创新以及Apple Intelligence在新市场的持续推广,后者将带来更强大的功能集。
服务业务的增长将继续以两位数的速度复合增长,预计2025财年第一季度App Store支出将增长15%,并且Apple服务的采纳仍有充足的增长空间。
AAPL股票在2025年迄今为止(截至2025年1月22日)下跌了11%,这使得其有望迎来自2022年12月以来表现最差的一个月。此轮疲软紧随AAPL股票好于季节性表现的一段时期(例如,2024年11月上涨5%,2024年12月上涨6%)。预计市场情绪将在年中改善,届时也是该股的季节性强劲时期,围绕Apple Intelligence对iPhone需求的有限影响和中国竞争的担忧可能会被转移到关注2025年全球开发者大会(WWDC)上揭示的Apple Intelligence新功能、2025年春季推出的新款Mac、iPad和iPhone SE产品,以及iPhone 17/18的新产品功能(2025年秋季/2026年春季)等因素上。
微软: F2Q25前瞻
大摩(K. Weiss, 25/01/22)
投资者情绪已经转为负面,因为围绕毛利率、资本支出、生成式人工智能(GenAI)盈利模式以及OpenAI关系的“忧虑墙”逐渐加大。鉴于微软在生成式人工智能领域的领先地位和吸引人的估值,这些担忧可能是暂时的,为微软股票提供了一个有吸引力的买入点。
关键要点:
-
股票表现不佳和投资者负面情绪
:这些因素为微软股票在需求背景稳定或改善时的超越表现创造了有吸引力的条件。
-
Azure增长预期
:第二季度若能达到买方的预期——以32-33%的同币种增长率,且增强下半年加速的信心,将是推动股票表现的关键催化剂。
-
M365 Copilot贡献预期下降
:由于我们在第四季度CIO调查后的预期调整,投资者目前对M365 Copilot的贡献预期已降至最低。
-
美元走强及Cruise投资减值
:这些因素导致我们下调了2025财年下半年的每股收益预期约1.7%,并将目标价从548美元调整至540美元。
-
估值与增长潜力
:以2026财年26倍GAAP每股收益估值计算,微软股票未能反映其在生成式人工智能领域的强劲定位和持续的每股收益增长潜力,我们仍然建议在2025财年下半年继续买入。
微软股票近期表现不佳,主要受以下忧虑影响:
-
美元走强
-
Azure容量扩展缺乏可见性
-
M365 Copilot采用疲软
,尤其是在代理(agents)使用的讨论中,情绪恶化。
-
OpenAI亏损和Cruise减值
尽管短期内这些因素导致财务预期和目标价下调(目标价从$548降至$540),但微软基本面仍然健康:
-
微软支出意向强劲
-
Azure在下半年有望加速
-
M365 Copilot的初步数据下降
已被模型反映,同时新的Copilot Chat和代理消费、消费者价格上涨等因素将提供增量动力。
因此,尽管投资者情绪较为谨慎,微软的基本面仍被看好,财报发布后可能成为一个“清理事件”,有望为未来更强的基本面奠定基础