核心观点
DeepSeek-R1模型发布,具有高性能、低算力需求的特性,带动小模型推理能力的提升,引发全球开发者及用户关注。R1作为开源模型性能接近头部闭源模型o1,一定程度上已经反映了AI平权,同时纯强化学习对推理能力的提升带来RL范式泛化可能,预计后续基模的持续迭代,有望推动AI全产业链持续保持高景气和高关注度,关注算力、应用、端侧、数据等核心投资机会。
行业动态信息
DeepSeek模型密集更新,高性能+低成本促进用户数高增
近期DeepSeek多款模型上线并完全开源,其中R1在推理任务上基本实现于o1相当的性能,Janus-Pro在多模态理解和生成方面表现较好。受春节信息传播下沉促进,DeepSeek出圈并成为全球增速最快的AI原生应用,第18天达到1500万日活。此外,DeepSeek通过算法迭代、架构升级,使通用及推理模型成本相较于OpenAI同类模型下降至数十分之一以下。
技术不断革新,大模型Scaling L aw仍有效
DeepSeek通过多头潜在注意力、MoE、多token预测等架构和基础设施创新实现了高效训练,并在R1-Zero模型验证了纯强化学习对推理能力的提升。尽管Pre-Training Scaling面临技术、算力、数据的制约,但强化学习带来了规模化扩张新方向,预计各厂商将陆续跟进,持续优化模型架构。
D e epSeek-R1促进AI平权,产业链享受发展红利
R1作为开源模型性能接近头部闭源模型o1,一定程度上已经反映了AI平权。同时,R1使小模型具备推理能力成为可能,更低的成本将更有利于开发者探索AI的实际落地。
投资建议:1)算力:算力建议关注以国产算力和AI推理需求为核心的算力环节,尤其是IDC、服务器、国产芯片等算力配套产业,推荐海光信息、浪潮信息、软通动力,并关注AIDC相关标的,如并行科技、宝信软件等;2)应用:B端推荐金蝶国际、鼎捷数智、赛意信息、用友网络、恒生电子、中控技术等;C端推荐金山办公、万兴科技、彩讯股份、同花顺等;3)端侧:教育推荐视源股份、科大讯飞等;其次新终端推荐虹软科技、联想集团等;4)数据:建议关注向量数据库、数据处理类企业,以及具备行业侧专业数据的厂商,关注拓尔思等。
风险分析
(1)AI产业商业化落地不及预期:目前各环节AI产品的商业化模式尚处于探索阶段,如果各环节产品的推进节奏不及预期,或对相关企业业绩造成不利影响;(2)市场竞争风险:海外AI厂商凭借先发优势,以及较强的技术积累,在竞争中处于优势地位,如果国内AI厂商技术迭代不及预期,经营状况或将受到影响;同时,目前国内已有众多企业投入AI产品研发,后续可能存在同质化竞争风险,进而影响相关企业的收入;(3)政策风险:AI技术的发展直接受各国政策和监管影响。随着AI在各个领域的渗透,政府可能会进一步出台相应的监管政策以规范其发展。如果企业未能及时适应和遵守相关政策,可能面临相应处罚,甚至被迫调整业务策略。此外,政策的不确定性也可能导致企业战略规划和投资决策的错误,增加运营的不确定性;(4)地缘政治风险:在全球地缘政治环境的波动下,尤其美国对中国的出口限制或将直接影响国内企业算力芯片的获取,进而影响其产品研发和市场竞争力。同时,地缘政治风险也可能导致AI产品开拓海外市场面临障碍,影响相关企业的营收情况。