本文来自方正证券研究所于2025年2月17日发布的报
告DeepSeek在投资研究工作中的应用初探——DeepSeek应用系列研究之一》,欲了解具体内容,请阅读报告原文,分析师:曹春晓 S1220522030005。
摘要
自
2025
年
1
月
DeepSeek R1
模型上线以来,引发了大量的关注和讨论,
1
月最后一周用户数呈现爆发式增长,仅仅
7
天即完成了
1
亿用户增长,成为超越
ChatGPT
的另一现象级产品。特别是春节假期期间,
DeepSeek
由于其低成本、高性能、开源的特点快速出圈,并在春节后迅速引发了各行业的加速部署,国产
AI
进程快速推进。
我们认为,
DeepSeek
对各行业的影响才刚刚开始。
对大型企业而言,由于数据敏感性以及需要微调模型等原因,普遍会进行私有化部署。就证券基金行业来看,华安基金、汇添富基金等多家头部公募基金公司,以及中信建投、国泰君安等多家头部证券公司,都已完成了
DeepSeek
私有化部署,将赋能数字化转型与业务效率提升。
金融行业投研工作中,经常面临大量数据分析、文字处理以及非结构化数据的挖掘等工作,
DeepSeek
的普及对于广大投研人员的日常工作将带来较大的影响
。本文中我们测试了
DeepSeek
在年报解读、纪要整理、数据分析、策略复现、因子挖掘等方面的应用潜力。
通过上述测试我们可以看到,对于日常的一些基础工作而言,
DeepSeek
可以很好的完成,并大幅提升研究人员的工作效率。然而我们也需要承认,对于类似策略复现、因子挖掘等问题,其过程相对较为复杂,且
DeepSeek
目前对生成的代码无法在后台运算检验,也无法获取策略中需要用到的具体数据,因此其代码仅可作为参考使用,实际中仍需要用户自己进行严谨核验及调试,方可应用于实际投资。
本文中的案例我们都是以普通个人用户的角色在使用
DeepSeek
,事实上
DeepSeek
在金融投研中的潜能远不止这些。如投研机构进行了私有化部署并能成功接入本地数据库(如
Wind
、彭博、朝阳永续等)以及本地知识库(如研究报告、调研报告等),那么
DeepSeek
可能在更为广泛的领域内大大增加投资研究工作效率。
风险提示
本报告基于历史数据分析,历史规律未来可能存在失效的风险;本报告中的案例仅供测试使用,不构成投资建议;
DeepSeek
回答结果不一,生成代码可能存在错误。
1
DeepSeek R1
上线以来用户快速增长,各行业加速部署落地
1.1
DeepSee
k
用户快速增长,官方服务器拥挤严重
自
2025
年
1
月
DeepSeek R1
模型上线以来,引发了大量的关注和讨论,
1
月最后一周用户数呈现爆发式增长,仅仅
7
天即完成了
1
亿用户增长,成为超越
ChatGPT
的另一现象级产品。特别是春节假期期间,
DeepSeek
由于其低成本、高性能、开源的特点快速出圈,并在春节后迅速引发了各行业的加速部署,国产
AI
进程快速推进。
与此同时,
DeepSeek
相关板块在春节后出现了大幅上涨,
Wind DeepSeek
指数在春节后的一周半时间累计涨幅达
48.32%
,同时也带动了上下游产业链公司的大幅上涨。
我们认为,
DeepSeek
对各行业的影响才刚刚开始。对大型企业而言,由于数据敏感性以及需要微调模型等原因,普遍会进行私有化部署。就证券基金行业来看,华安基金、汇添富基金等多家头部公募基金公司,以及中信建投、国泰君安等多家头部证券公司,都已完成了
DeepSeek
私有化部署,将赋能数字化转型与业务效率提升。
1.2
本地部署
DeepSeek-R1
模型示例
高速增长的用户使得
DeepSeek
官网访问量激增,同时由于其自身算力限制,近期
DeepSeek
官网及
APP
频繁出现服务繁忙的提示。
由于
DeepSeek
系列模型已开源并附有详细的文档说明,理论上任何人都可以进行私有化部署。然而由于高性能版本的
DeepSeek
模型对本地算力的要求极高,对普通用户而言难以实现高配版本模型落地。对于私密性要求较高且模型性能要求没那么高的用户,可以尝试通过如下步骤来进行私有化部署低配版模型:
1
)准备工作:
安装
Ollama
首先需要根据个人电脑来选择合适的
Ollama
版本,通过
Ollama
官网直接下载对应的版本并安装,安装完成之后启动运行
Ollama
。
2
)安装部署:
安装
DeepSeek R1
回到
Ollama
官网,找到
DeepSeek-R1
模型,打开之后即可看到
DeepSeek-R1
模型的
1.5b-671b
不同量级的版本,此时需要特别注意要部署的电脑配置,如果配置较为普通,建议选择
1.5b
或
7B
版本。
打开电脑命令行,输入
Ollama
提供的对应模型的部署命令,运行并等待即可,待全部运行结束之后即已完成部署。部署完成的
DeepSeek R1
模型以命令行的方式运行,用户可以直接进行文字交互。
以上步骤部署的
DeepSeek
模型无法进行联网测试,且命令行交互方式不够友好,用户可以通过多种方式为其安装图形用户界面。此处我们以
Page Assist
为例,
Page Assist
是一款开源的浏览器扩展程序,旨在通过本地
AI
模型提供直观的交互界面,使用户能够在任何网页上与
AI
模型进行对话和交互,支持
Chrome
、
Edge
、
Firefox
等主流浏览器。以
Firefox
为例,直接在浏览器扩展窗口搜索
Page Assist
,添加扩展即可。添加完成之后我们打开
Firefox
浏览器扩展标签,即可自动关联到我们本地的
Ollama
,选择嵌入本地模型,选择部署的
DeepSeek-R1
,即可在浏览器内进行交互,同时也可进行联网搜索。
1.3
相较而言云厂商提供的高配版
DeepSeek
模型性价比更高
本地部署模型固然有非常多的好处,但其对资源的消耗非常明显,特别是参数相对较大的模型,需要专业级显卡支持,如中等模型
32b
,微调显存需求达到
128-160GB
,可能需要两块
A100
显卡搭配才能满足,对于普通用户来说本地部署的意义并不大。
此外,随着
DeepSeek
关注度的不断提升,国内云厂商如阿里云、百度智能云、腾讯云、硅基流动与华为云等都迅速接入了
DeepSeek
全系列模型。对于普通个人用户,在
DeepSeek
算力大幅提升之前,仍然有非常多的途径来使用高配版的
DeepSeek R1
模型。
我们以国内最早接入
DeepSeek
系列大模型之一的硅基流动为例,介绍如何使用
671b
版本的
DeepSeek R1
模型。
1)
首先我们需要在硅基流动官方网站注册新用户,并进行实名认证。
2)认证完成之后即可在模型广场中筛选
671b
的
DeepSeek R1
模型进行在线体验。此外,也可以通过硅基流动
+chatbox
的方式,通过
chatbox
终端调用硅基流动
API
来使用。本文后续部分的测试将全部基于硅基流动
+chatbox
模式调用。
2
DeepSeek
在金融投研工作中的基础应用测试
金融行业投研工作中,经常面临大量数据分析、文字处理以及非结构化数据的挖掘等工作,
DeepSeek
的普及对于广大投研人员的日常工作将带来较大的影响,本节内容我们将测试部分日常工作场景中的应用案例。
我们首先测试
DeepSeek
模型对上市公司财报的解读能力,目前上市公司
2024
年年报大多尚未披露,我们以已发布
2024
年年报的指南针为例,将其最新年报直接发送给
DeepSeek
,可以看到其解读和提炼关键数据的能力非常突出,对于不断扩容的股票市场,
DeepSeek
的快速普及可以大幅度提升投研工作效率。
同样,投研工作中调研纪要及会议纪要整理等基础工作需要耗费较多时间和精力,我们可以直接将这些文件传给
DeepSeek
,让其提炼核心观点。以下为测试提炼会议纪要的观点,整体来看能够精确概括文件内容的核心要点。
在报告《
Code Interpreter
在金融市场数据分析中的应用——
ChatGPT
应用探讨系列之五》中,我们曾介绍过早期
ChatGPT
可以借助插件
Code Interpreter
等完成大量数据计算和分析。随着大模型技术的不断迭代,目前很多基础性的数据分析工作都已可以由大模型直接完成。比如此处我们将基金重仓股数据发给
DeepSeek
,可以看到
DeepSeek
可以快速完成基金重仓股的分析,并且能够自主发现一些值得重视的边际变化情况。
3
DeepSeek
在策略复现、因子挖掘等方面的应用
3.1
DeepSeek
研报复现能力出众,但复杂任务的代码仍需手动调试
上文中我们验证了
DeepSeek
在年报解读、纪要整理、数据分析等维度的能力,基本可以实现投研工作中的一些基础需求,对于工作效率的提升有较大帮助。接下来我们测试其在研报复现,代码生成等维度的能力。
在方正金工多因子选股系列研究中,我们基于日内大单成交后的市场跟随效应构建了一个非常有效的选股因子——“待著而救”,其经济学含义可以解释如下:在股票交易过程中,当某些股票产生突发性利好信息或者有较强改善预期时,普通投资者往往由于获取信息和处理信息能力上的劣势,难以快速发觉机会,而拥有信息和专业优势的投资者可能会在短时间内大量买入,使得成交量激增,而成交量激增的股票往往会吸引到更多普通投资者的关注,可能会导致其跟随买入,造成股票价格短期内出现反应过度,未来存在较大的回落风险。相反,如果股票成交量大增后,市场并未产生明显跟随,则可能意味着出现了反应不足,这些股票后续可能存在一定的超额收益。
我们将报告原文直接发送给