专栏名称: 广发证券研究
推送研究所的最新报告和观点
目录
相关文章推荐
郁言债市  ·  短久期城投债,配置正当时 ·  16 小时前  
中国证券报  ·  停牌!603963,面临退市风险 ·  4 天前  
中国证券报  ·  A股增量资金,集结! ·  4 天前  
中信建投证券研究  ·  中信建投 | 2月转债市场展望与组合推荐 ·  4 天前  
51好读  ›  专栏  ›  广发证券研究

广发如是说 | 关于DeepSeek

广发证券研究  · 公众号  · 证券  · 2025-02-05 07:10

正文

【广发如是说】系列围绕最新市场热点,传递广发研究观点。本期关于:DeepSeek。

DeepSeek-V3于2024年12月26日上线并开源;R1模型于2025年1月20日发布并同步,性能对标OpenAlo1正式版。如何看待DeepSeek大模型的性能和应用前景?对AI产业带来的影响如何?将带来哪些投资机遇?广发策略联合行业带来最新解读。

目 录

策略 | Deepseek的A股叙事

通信 | DeepSeek-R1模型发布,持续关注算力产业链投资机会

计算机 | DeepSeek发展态势符合我们去年深度报告对其的判断

传媒 | DeepSeek登顶多国榜单,看好大模型性价比提升带来应用端机遇

电子 | DeepSeek模型创新和杰文斯悖论

机械 | 人形机器人首登春晚,特斯拉指引超预期

军工 | 海内外AI持续发展,装备领域多垂直场景应用可期


联合电话会议

主题丨 Deepseek行业联合解读&春节重要数据分析

时间丨 2025-02-04 19:30

主讲人丨 刘晨明、韩东、刘雪峰、耿正、叶敏婷、孙柏阳、孟祥杰、许可





策略:Deepseek的A股叙事



Deepseek口碑爆棚,影响力出圈,成为了科技领域新的产业催化剂。 春节后市场躁动行情有望开启,重点关注春节期间产业催化的科技领域,市值风格更偏中小板块。 配置上重点关注: (1)TMT内部的高低切,历史区间上涨概率和涨幅居前、今年跌幅较大的计算机/传媒,以及 有望受益于Deepseek产业催化的AI端侧及应用领域 。(2)前期下跌、两会前后有产业催化剂的主题性机会:文化出海,银发链,生育链。

春节前后,围绕科技产业主要有两个市场热议话题: 第一,节前披露的基金24年四季报显示,电子再度成为公募基金单季增持第一的行业,配置比例刷新历史新高; 第二,国内大模型Deepseek火爆出圈,其在能力、成本、开放性等方面备受瞩目,也为后续AI产业的发展前景提供了无限可能。

后续对于科技风格和TMT板块的判断,可以分为短期和中期两个维度来看待:

短期而言,节后的科技板块表现,可能会出现科技股或TMT内部的高低切换。一方面,Deepseek的科技成果给AI垂直向下的端侧和应用带来更大想象力, 参考13-15年智能手机到移动互联网的产业路径,从硬件→基础设施→终端→应用,国内在通用技术赋能的应用创新领域有着丰富的发展经验(互联网+),这将给整个科技及TMT产业链带来深远影响(AI+),其中偏上游的硬件算力短期逻辑或受到挑战,而端侧和应用的创新将迎来广谱空间。 另一方面,基金四季报显示出TMT内部持仓分化,其中硬件相关的AI芯片/SOC等配置比例迭创新高,机器人/光模块/消费电子也处于较高水平, 22年以来公募单季增持第一的行业,在下个季度的市场表现排名往往处于中下游;而软件及应用领域的计算机/传媒等配置处于历史极低位置,如果低持仓板块遇到产业催化剂,带来的股价弹性往往更大。 综合Deepseek引发的产业思考,以及基金季报的筹码结构,我们认为TMT板块将出现内部“高低切” ——之前跌幅较大、端侧及应用相关、机构持仓轻的行业更受益,如计算机/传媒;而之前涨幅高、机构持仓拥挤、短期逻辑受影响的算力及硬件环节或出现股价波动,不过,考虑到这种筹码扰动多集中在一个季度,也可以利用波动布局其中真正能出订单、有业绩支撑的公司。

中期而言,要关注科技成长风格从主题驱动转为基本面驱动、进入趋势性占优的可能性。 在过去2年中国AI产业发展中,A股能够“出业绩”的公司数量占比,与13-15年的移动互联网产业,19-21年的新能源产业相比,仍然大幅不足。 展望中期维度,业绩增速差是决定风格相对趋势的核心因素,DeepSeek横空出世会给后续的AI产业带来较强的支撑,有望再度带动科技成长风格业绩增速差走阔。 DeepSeek的示范效应主要预示着①开源,②低成本。这预示着,硬件端的低成本和高效率有望加速终端渗透,大模型应用落地也在提速。未来产业链上越来越多的公司将从主题炒作、逐步进入真正“出业绩”的阶段。中期来看,科技成长风格有望重新迎来业绩的趋势性占优。

DeepSeek的低成本训练+强化学习模式对大规模投入进行预训练的海外AI发展模式产生冲击, 从1月28日到1月31日,美股市场AI产业链公司的表现来看,硬件端公司的跌幅较大,但是应用端(包括大模型和云计算)多数表现较不错。

DeepSeek对算力需求的影响在短期存在争议。但确定性较高的是:DeepSeek推动的“开源”+“低价”+“蒸馏”的模式,将推动AI应用加速发展,并推动推理测需求提升。 第一,DeepSeek“开源”的模式天然有助于推动AI生态完善和AI应用落地。第二,通过低成本,DeepSeek实现了低定价。在性能不分伯仲的情况下,其API价格显著低于GPT-o1。第三,DeepSeek-R1允许用户通过蒸馏技术借助 R1 训练其他模型,有助于推动垂直化小模型发展,进而促进AI应用落地。

虽然对于国内开源Deepseek引发的产业前景,短期还存在一些争议和讨论。不过,毋庸置疑的是,国产大模型正在以更低的训练成本,实现或接近海外先进闭源模型的综合能力,表明中国在人工智能领域取得突破性进展。

风险提示 地缘政治冲突超预期;全球流动性宽松的节奏低于预期;国内稳增长政策力度不及预期使得经济复苏乏力等。

相关报告 《Deepseek的A股叙事——春节全球大事记——周末五分钟全知道(2月第1期)》 2025-02-04;作者:刘晨明 S0260524020001;郑恺 S0260515090004;杨泽蓁 S0260524070003



相关会议

主题丨 DeepSeek的A股叙事——春节全球大事记

时间丨 2025-02-04 20:30

主讲人丨 刘晨明


通信:DeepSeek-R1模型发布,持续关注算力产业链投资机会



2025年1月20日,DeepSeek-R1发布,性能对标OpenAI o1正式版,公司同步开源模型权重。

性能对齐OpenAI-o1正式版,蒸馏小模型超越OpenAI o1-mini。 DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在较少标注数据的情况下,较大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。数学能力方面,在Math-500评估基准中,DeepSeek-R1的准确率为97.3%,而o1为96.4%;编程能力方面,在SWE-bench Verified代码生成评估基准中,DeepSeek-R1的准确率为49.2%,而o1为48.9%。蒸馏小模型方面,公司在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。

开放的许可证和用户协议,成本远低于海外大模型。 DeepSeek-R1拥有开放的许可证和用户协议。为了推动和鼓励开源社区以及行业生态的发展,公司的开源仓库(包括模型权重)统一采用标准化、宽松的MIT License,完全开源,不限制商用,无需申请。产品协议明确可“模型蒸馏”,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),每百万输出tokens 16元。对比海外大模型,o1-mini每百万输入tokens API服务定价为11元(缓存命中),o1-preview和o1则为55元;o1-mini每百万输出tokens API服务定价为88元,o1-preview和o1则为438元。

DeepSeek-R1有望拉近中外模型的差距。 DeepSeek-R1一定程度上创新了模型训练和推理的方式,说明单纯堆算力不是提升模型训练能力的唯一路径,模型架构上的一些巧思如强化学习、稀疏激活等亦可提升模型训练速度、降低训练推理成本。训推成本的降低,非常利好AI应用的快速增长,长期抬升推理侧算力需求。在AI的大推理时代,受益于推理及训推一体增长的需求,算力需求将持续旺盛。

风险提示 AI基础设施建设不及预期的风险;AI应用发展不及预期的风险;AI领域的进出口政策变化的风险;国际合作减少的风险。

相关报告 《通信行业:DeepSeek-R1模型发布,持续关注算力产业链投资机会》 2025-02-03;作者:韩东 S0260523050005;王亮 S0260519060001;戎志强 S0260523090001



相关会议

主题丨 DeepSeek对算力产业投资的影响,大推理时代系列电话会第二期

时间丨 2025-02-04 10:00

主讲人丨 韩东



计算机:DeepSeek发展态势符合我们去年深度报告对其的判断



2024年12月和2025年1月分别推出DeepSeek-V3和DeepSeek-R1大模型。针对其性能水平我们进行了测试,并在相关报告中对其技术原理、性能水平和应用前景进行了深入分析和前瞻性判断:

1.我们在2024年12月29日的深度报告《计算机行业:比较试用DeepSeek看模型走向应用的新迹象》中写到 “在生成质量方面,DeepSeek-V3在多项评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并与全球顶尖闭源模型如GPT-4o和Claude-3.5-Sonnet处于同一水平。DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。证明了模型效果不仅依赖于算力投入,即使在硬件资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。”

2.我们在2025年1月26日的行业报告《计算机行业GenAI系列(二):国产大模型密集发布,百花齐放竞逐未来》中写到 “DeepSeek推出其最新一代推理模型DeepSeek-R1,性能比肩 OpenAI o1正式版。DeepSeek团队革新了传统的训练方式,尝试抛弃监督微调步骤,转而通过多轮强化学习实现模型的迭代优化,反映了纯RL路线的有效性。这种创新模式为国产AI大模型在后训练阶段提供了一种新的技术选择,有望进一步缩短国产厂商与国际领先厂商在AI大模型领域的技术差距。”

根据彭博社,截止2025年1月31日,DeepSeek的App在全球140个市场中的移动应用下载量排行榜上位居榜首。此外,近期,微软Azure、亚马逊AWS、华为云和百度云等云平台陆续接入并提供DeepSeek-R1的云服务。这正是验证了此前我们对于DeepSeek大模型性能和应用前景的判断。 DeepSeek大模型的技术革新给整体AI行业带来的影响是积极且深远的,具体包括:

1.短期来看, DeepSeek的技术创新降低了AI大模型的算力成本; 长期来看, 较低的算力成本推动了AI大模型应用的普及,从而拉动整体算力需求的增长。

2.系统级AI计算平台方面, 有别于行业通用的CUDA平台,DeepSeek采用的PTX(Parallel Thread Execution)带来了较好的加速效果。这或将对与英伟达AI芯片强绑定的CUDA生态产生影响,并推动国产AI芯片生态的拓展。

3.DeepSeek系列模型从性能端看实现了与国外领先大模型的对标,从成本端看具有较高的性价比优势,基于其带来的性能提升+推理成本下降趋势,有望驱动AI应用快速渗透。 大模型性能持续提升为应用厂商提供了灵活调用多模型的选择,AI应用厂商可基于不同场景动态切换底层大模型,降低了技术依赖。而推理成本的下降使得AI应用厂商能够以更低成本、更高效率开发高价值应用,降低了AI技术的门槛,更多中小型企业和开发者能负担大模型所需的资源,长尾应用将被激活。因此,在到达一定水准后,应用开发的边际成本大幅下降,将加速AI大模型的大规模商业化应用普及。

风险提示 AI大模型技术追赶和竞争加剧的风险;高研发投入带来的资金压力;由于下游生态和使用环境的差异,商业化成功有不确定性;AI算力需求增长节奏的不确定性。

相关报告 《计算机行业GenAI系列(三):DeepSeek发展态势符合我们去年深度报告对其的判断》 2025-02-04;作者:刘雪峰 S0260514030002;周源 S0260523040001



相关会议

主题丨 计算机行业GenAI系列(二):国产大模型密集发布,百花齐放竞逐未来

时间丨 2025-01-27 12:30

主讲人丨 周源




传媒:DeepSeek登顶多国榜单,看好大模型性价比提升带来应用端机遇



DeepSeek-V3于2024年12月26日上线并开源;R1模型于2025年1月20日发布并同步开源,并在DeepSeek官网与App同步更新上线。DeepSeek App下载量于1月27日登上中国、美国、英国等多国免费榜首。

模型推理能力、性价比及用户体验优势凸显,App登顶多国榜单。 DeepSeek R1模型数学、代码、自然语言推理等性能比肩OpenAI o1,同时高效训练降低了成本、提升了模型的性价比,DeepSeek-R1 API服务定价显著低于o1-mini/o1/o1-preview模型。在推理过程中,DeepSeek可向用户展示“深度思考”过程,成为用户创作、思考时的实用伴侣。DeepSeek官网访问量在R1模型发布后实现显著提升,1月28日全球访问量超过3700万次,iPhone端App日下载量在中国、美国、日本等国家达到30万次左右,登上中国、美国、英国等多国免费榜首。

DeepSeek模型的发布和开源,对于AI应用发展具有深远意义。 (1)DeepSeek采用开源模式,公开模型代码和论文,并明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型,打破了AI技术垄断,降低了应用开发门槛,为应用开发者带来新机遇。(2)R1模型中期训练阶段分配更多时间优化策略带来了推理能力提升,未来有望加速在医疗、金融、教育等领域的应用落地。(3)DeepSeek模型推理计算出色、计算效率较高,证明大模型公司能够通过精准的技术路线实现高效利用资源,大模型有望持续实现性能的提升和价格的降低,为AI应用开发者提供更好的技术土壤。

B端来看, DeepSeek R1模型不仅实现了推理能力的突破,且通过高效的技术带动了大模型价格显著下降,长期有利于促进AI应用的多元化。 C端来看, DeepSeek产品具备强大的推理能力和较好的使用体验,带动了产品在用户中的出圈,未来AI应用渗透率有望持续提升。 持续完善的AI基础设施和持续扩大的用户基础有望更好促进AI游戏、AI影视、AI营销、AI情感陪伴、AI教育、AI agent等场景的创新。

风险提示 模型迭代效果不及预期,商业化应用落地不及预期,版权、伦理、内容质量的风险等。

相关报告 《传媒行业·AI系列跟踪:DeepSeek登顶多国榜单,看好大模型性价比提升带来应用端机遇》 2025-02-04;作者:旷实 S0260517030002;叶敏婷 S0260519110001;章驰 S0260523080001;罗悦纯 S0260524120001



相关会议

主题丨 传媒早8点:DeepSeek对AI应用意义解读

时间丨 2025-02-05 08:00

主讲人丨 叶敏婷



电子:DeepSeek模型创新和杰文斯悖论



DEEPSEEK-V3大幅降低训练成本,具有三大创新点。 基于算法、训练框架和硬件的整体设计,使得DeepSeek V3的训练非常高效且低成本。 (1)结构创新: DeepSeek MoE 和 MTP。 (2)训练创新: 自研高效率的训练框架,包括 训练创新1: 高效双流并行性的DualPipe算法; 训练创新2: 高效的跨节点AII-to-AII通信内核; 训练创新3: FP8训练降低显存的同时保障模型精度。 (3)推理创新: PD分离。

DEEPSEEK-R1-ZERO/-R1推理模型通过RL出现aha时刻。 DeepSeek-R1-Zero是一个没有进行监督微调(SFT),仅通过大规模强化学习(RL)训练出的模型,出现了aha时刻,展示了显著的推理能力,但存在可读性差、语言混合等问题。为了解决这些问题并进一步提高推理性能,在RL之前结合多阶段训练和冷启动数据,训练出了DeepSeek-R1模型。DeepSeek-R1在推理任务上的性能可与OpenAI-o1-1217相媲美。通过DeepSeek-R1的输出,深度求索还蒸馏了6个小模型并开源,其中32B和70B模型在多项能力上实现了对标 OpenAI o1-mini的效果。

DEEPSEEK引发杰文斯悖论。对于大模型训练: 海外模型大厂如果保持原有技术路径,则训练的算力需求继续增长;如果吸收DeepSeek的训练经验,降低训练成本,则需要观察海外模型大厂训练模型的数量以及规模增长幅度带来的算力需求增长是否能超越成本的下降。国内模型厂商在美国出口管制的情况下,参考DeepSeek的训练经验,可以利用降规版本的英伟达GPU继续训练出更好的模型,训练的算力需求有望继续增长。







请到「今天看啥」查看全文


推荐文章
郁言债市  ·  短久期城投债,配置正当时
16 小时前
中国证券报  ·  停牌!603963,面临退市风险
4 天前
中国证券报  ·  A股增量资金,集结!
4 天前
中信建投证券研究  ·  中信建投 | 2月转债市场展望与组合推荐
4 天前
央视网体育  ·  新疆男篮终圆梦 CBA新王登基未来可期
7 年前
宇宙解码  ·  宇宙到底有多大?
7 年前
中央广电总台中国之声  ·  中印边界再生摩擦真相是什么?印度为何此时玩火?
7 年前