专栏名称: IPO早知道
图哇图哇网络
目录
相关文章推荐
都市现场  ·  首批苏-57战机将抵达阿尔及利亚 ·  2 天前  
都市现场  ·  首批苏-57战机将抵达阿尔及利亚 ·  2 天前  
科技新知  ·  阿里搞定苹果,为马云赚足了面子 ·  2 天前  
科技新知  ·  阿里搞定苹果,为马云赚足了面子 ·  2 天前  
51好读  ›  专栏  ›  IPO早知道

对话「熵简科技」费斌杰:DeepSeek-R1大幅降低投研模型训练成本,AI涌现推理过程支持投资决策

IPO早知道  · 公众号  · 科技创业  · 2025-02-19 17:33

主要观点总结

本文介绍了熵简科技创始人费斌杰对AI辅助投研领域的深度洞察和展望。熵简科技利用AI技术帮助金融机构实现投研效率的提升,推出了一系列基于AI辅助投研的产品和服务。文章涵盖了熵简科技在AI辅助投资决策演进、金融领域AI新投资范式产生、DeepSeek模型的应用和发展趋势等方面的内容。

关键观点总结

关键观点1: AI辅助投研在向AI辅助投资决策演进

熵简科技推出的AlphaEngine产品已经实现了多步推理问答、精准资料溯源和融合分析师思维等功能,帮助投资机构提升投资效率。DeepSeek模型的应用使得AI在投研领域的应用更加广泛,提高了金融机构的投资收益。

关键观点2: DeepSeek模型在金融行业的应用价值

DeepSeek模型的出现为金融行业带来了新的机会,通过强化学习解决具有明确反馈的问题,如推荐股票等任务。此外,DeepSeek模型的应用还能够帮助第三方AI服务商更精细地服务客户需求,提高部署模型的效率。

关键观点3: 金融机构对AI人才的需求

金融机构需要引进懂算法的人才,具备彻底操盘大模型的训练能力,熟悉架构和算法优化的人才更受欢迎。同时,具备SaaS化订阅服务能力的海外客户也更容易获得金融机构的认可。

关键观点4: AI对金融资管领域的改进和未来发展

AI在金融服务领域的应用正在从辅助投资决策向普惠和平权发展,有助于推动优质投研能力的普及。此外,AI技术还可以帮助金融机构更好地理解宏观政策,提高投资策略的稳定性和市场的透明度。


正文

AI辅助投研在向AI辅助投资决策演进。

本文为IPO早知道原创
作者|罗宾
微信公众号|ipozaozhidao
在金融领域,DeepSeek已经在加速AI新投资范式产生。近日,IPO早知道对话了智能投研服务商「熵简科技」创始人、CEO费斌杰,他分析了DeepSeek如何驱动投研AI应用带来效率突破,提升投资的超额收益。


今年春节期间,熵简科技基于DeepSeek-R1模型对FinGPT进行了定向蒸馏训练,以有限的算力支持大量用户访问。公司推出了国内首个具备深度推理能力的金融大模型FinGPT Deep,并搭载于熵简科技的智能投研平台AlphaEngine。


FinGPT升级后,AlphaEngine实现了1)多步推理问答;2)精准资料溯源及3)融合分析师思维,展示完整投研分析过程的功能,让投资线索主动浮现。作为金融专业人士的AI搜索引擎,AlphaEngine已有超40000名机构投资者用户。


在DeepSeek于今年1月发布的论文《DeepSeek-R1:通过强化学习提升大型语言模型的推理能力》中的关键结论让熵简团队清晰认识到, 现在训练行业模型的最佳方式是以开源的基座模型去蒸馏行业小模型。 蒸馏过程中的行业特定训练集由机器学习的规则化模型训练生成,取代对人工标注的依赖。


费斌杰表示:“这是DeepSeek-R1给第三方AI厂商带来的重要机会。我们有丰富的技术能力,但之前受限于没有庞大的投研团队贡献大规模的专业知识数据集,现在这个痛点可以靠涌现的方式来攻克,距离这个行业产生智能化突破就不远了。”


他认为,投研场景中, 强化学习可用于解决具有明确反馈的问题: 推荐股票等任务的反馈(如股票涨跌)是确定的,这种任务确定性使得强化学习更加高效,因为金融类模型不需要通过对话得出反馈。第二,进一步看,投研模型训练中,可以选定有明确反馈的问题作为评判模型,这样 通过规则化评价模型来优化投研模型表现,可大幅降低模型训练成本、加速模型收敛


另外,随着部署模型趋于一种平价的服务,费斌杰表示,第三方AI服务商更应该将自己擅长的领域做精做细。“DeepSeek等模型开源使很多企业可能将重新考虑是否继续投入更多资源进行模型的部署。因此对第三方AI厂商来说,未来部署模型可能不再是一个好的选择,而要找到与企业之间新的合作模式,例如企业方可以自主部署模型,我们则通过标准化的接口去服务企业内部的场景。”


以下是对话内容(有删节):


费斌杰(来源:受访人提供)


IPO早知道:公司成立至今业务上有哪些主要变化? 部署 DeepSeek 后有哪些计划


费斌杰:1)大模型出来之前的4-5年,我们主要帮助国内券商、公募基金等大型资管机构建立了投研数据中心,标准化地积累了私域的行业数据。


2)第一个转折点是大模型出来后,我们发现AI在技术上的质变,把我们之前的工作积累转化为标准化产品,推出了旗舰产品AlphaEngine。用户可以在我们的专家数据库中做搜索。由于它提供的全新的AI辅助投研的体验,产品推出后一年时间,用户从零增长至40000多,服务了超5000家国内资管机构。


3)DeepSeek-R1的出现对行业和我们来说都是新的转折点。此前的产品定位是AI辅助投研,现在我们的产品正在往AI辅助投资决策方向演进。我们从去年开始就根据大量客户调研理出了大概三四十个辅助投研的功能清单,上一版模型只能实现其中的20%不到,现在,这一比例有望提升到40-50%,有效边界又前进了一步。


IPO早知道:在进一步分析这种转折点之前,现在哪些数据的价值没被充分挖掘?


费斌杰:数据在很多层面都远远未被挖掘出来。很明显的一点是研究报告中的信息含量在大幅衰减,而各种会议的信息密度越来越高,每天有大量公开会议和一到几人的小型会议,它们的时效性强,把这些会议资料都进行文本化分析,一定有高价值。


也正是因为我们的平台接入的是这类行业私域的资料库,所以我们在以DeepSeek-R1模型进行蒸馏后,AlphaEngine的用户体验有一种质变。


IPO早知道:对视频尤其是外文视频信息的准确提取会有难度吗?


费斌杰:这是可以实现的。视频资料对AI的传导路径有两种,一种是把视频资料直接交给多模态模型去分析,但这样成本过高,结果也不一定准。另一种普遍采取的方法是将视频里的音轨提取出来,翻译成文字再做文本分析,由于删除了图像内容,语音转文字的准确度要求更高。


所以为了让模型最终的回答效果更好,我们不仅要有一个强大的基座模型,还要有优质的多模态数据转化模型。我们现在也在做这件事情,针对会议视频做了FinAudio的模型,可以将投研类会议的音频数据准确地翻译成文本,其中涉及的专有名词由一些人员去标注数据。在训练完这个模型后,很多金融机构都成功部署了,这也是市场的一种刚需。



AI模型自主涌现推理过程
DeepSeek-R1突破智能投研痛点


IPO早知道:AI模型 如何在 投研 中支持 或提示 做决策 、局限性是什么?DeepSeek对此带来的具体突破是什么?


费斌杰:这个问题很深,但根据DeepSeek-R1论文里的做法, 这个问题有明确结论:现在我们要训练行业模型,最佳方式是以开源的基座模型去蒸馏行业小模型。 蒸馏的过程中我们应该准备一些行业内的特定领域训练集,这些训练集不需要靠人工数据标注产生,而更多是由机器学习的规则化模型来生成。


几年前要以AI方法支持投研,机构得让分析师、基金经理帮AI厂商标注很多数据,让机器按照专业人员的知识图谱、分析框架 进行有监督的学习,这样效率很低 。投研专业人员又是人数很少的群体,最终产生的训练集规模远远不够,更别说去满足600B参数级别大模型的需求。


DeepSeek-R1论文中提到的中间模型DeepSeek-R1-Zero就已经验证了一个关键结论: 不用标注数据、不用做SFT(监督微调),只需要纯强化学习,就能让大模型涌现出一些推理过程。 这就意味着,在我们行业, 只要准备足够多的有明确结论的数据集,就可以以规则化的方式来产生强化学习的训练集


比如我让大模型推荐下周最有可能跑赢大盘的10只个股,这就可以作为一个有明确结论的问题。大模型通过各种方式去推理,可以用财务数据、市场情绪、龙虎榜、专家分析等等方法,最终它给出的10只股票我们可以用一套规则化的系统检验它们是不是跑赢了。现在,这样的训练集能批量产生,几乎是无穷无尽的。


大模型利用这些训练集,会自己涌现出推理过程,通过强化学习来想明白一家公司是否值得投资,是要价值投资,还是通过分析量价来投资。


我认为这是DeepSeek-R1给我们第三方AI厂商带来的一个很重要的机会。 我们有丰富的技术能力,但之前会受限于没有庞大的投研团队贡献知识数据, 现在这个痛点可以靠涌现的方式来攻克了,距离这个行业产生智能化的突破就不远了。


IPO早知道:基于这种 推理能力的提升 AlphaEngine 产品 还有哪些需求 可以被实现


费斌杰:有很多了,首先一个例子就是我们最近在攻克的一个需求: 让AI来挖掘投资线索 ,目前来看实现起来没有太大问题。


投资者的挖掘能力是资管行业最核心的能力,但这个事的难度是比大家想象的要高很多,因为它也分你要寻求的是短期、中期还是长期机会,越长期肯定越难,它里面思考的深度越深。


目前R1的推理能力比较适合挖一些短中期机会,所以我们准备 这种挖掘投资线索的能力 作为一项标准服务提供给机构投资者用户 ,为之提供有效的辅助。


另一个例子,投研本质上就是在不确定的信息中去挖掘出正确的非共识,所以 怎么让大模型判断某个信息是“非共识”还是“共识” 就很重要。


具体来看,比如有一些投资经理就希望让AlphaEngine写一个投资日报,排除所有的市场一致预期。用户就想看过去一天市场发生了哪些变化,其中哪些信息是与市场预期相背离的,把这些信息总结到100字左右的短文就够了。这时候我们就可以基于大模型用技术的手段去解决。


IPO早知道:基金经理经验的价值更凸显在哪些投资风格中?


费斌杰:就像刚才提到的,优秀的基金经理对中长期机会的把握目前是超过AI的,他们知道怎么从海量的信息中找到最关键的判断标准并坚持,至少现在AI的推理能力达不到这个层次。三个月以上都算偏长期的投资维度了。


价值投资做到极致,或高频量化做到极致,都很难被AI取代。我们的模型更适用于寻找非长期机会的中低频策略。而且在风格漂移的阶段,AI可能会做得更好,会更灵活地切换风格。



AI多快成为新的alpha来源
取决于算法创新


IPO早知道: 投资者对数据的 利用 效率不断提高,某种策略alpha衰减 也在加快 投研服务 如何 帮他们 找出适合不同阶段的 投资 策略?


费斌杰:我也被很多朋友问到这个问题。我还没完全想好,但整体感受是AI一定会成为一个全新的alpha来源,这也是未来两三年会出现的一波全新的机会。对投资机构和投研服务方来说,就看谁能把握得更快了。必须将AI的能力内化。


AI行业应用的扩散将遵循典型的“创新扩散曲线”:早期采用者获得超额收益,中期跟随者形成竞争均衡,最终演化为行业基础设施。


内化的意思不是说部署一个本地模型,也不是接一个API,而是真的能够在算法上创新,首先就要把DeepSeek-R1的论文吃透,此篇论文中把PPO算法优化成GRPO算法,就是一个很大的改进。国内有这样的懂算法的人才,但金融机构能不能物色到这样的人才,并将算法和场景做结合,这是能否抢占先机的关键。


IPO早知道:他们一般来自于哪里?画像是什么?


费斌杰:自己彻头彻尾的操盘过大模型的训练的人会更合适,不应该是纯做应用或纯做Agent layer的一类。至少得做过MoE模型的训练,熟悉架构,知道怎么做pipeline、怎么做分布式训练。当然,像DeepSeek那样招到一些清北的数学天才,从理论层面做算法创新,确实是更宝贵的。


IPO早知道:熵简也在服务一些海外对冲基金,他们的需求与国内有什么差异?


费斌杰:我们拓展海外客户最大的契机是前几年全球对中国资本市场的关注太少,我们希望借此机会让外资更多地理解和关注中国的资本市场,这是一个挺大的机遇。同时,中国的AI应用能力有显著的溢出效应,在国际上我们的产品力并不逊于海外的同类公司,中国不缺AI人才。


海外机构更多关注的是大类资产配置。因为中国是他们配置的一个选项, 他们提出的问题普遍会 宏观一些 不会一开始就关注很多个股,而是从政策等角度进行分析。


第二,从我的感受来看,国外的AI应用虽然在资本市场比较火热, 在我们细分行业海外 产品的迭代速度比国内可能 慢两到三步左右。因此,我们的产品出海时遇到的阻力其实比较小。 更多的情况是客户感受到“你有这个功能,我没用过”,而不是“这个功能我们已经用过了,你相比它有什么优势”。


第三,海外客户付费能力确实强,且更愿意支持SaaS化的订阅制服务。国内客户更倾向于私有化部署或定制化服务,但海外很少有机构愿意这样做,这可能也与海外人力成本高有关。



AI进化推动优质投研能力的普惠和平权


IPO早知道: AI 服务于 金融资管 有哪些 方面今后 可以较快 改善


费斌杰:以无人驾驶作类比,投研领域的L4阶段最终目标应该是每个投资机构都可以把优质的训练集或优质的独家行业资料喂给自己的AI,让大模型能给出决策判断,这一步何时实现还要打个问号。


但现在行业正在从L1向L2迈进的进程是比较确定的 ,我们可以往AI辅助投资决策做一些探索,从寻找中短线机会开始尝试更长线的投资布局,而且AI支持下的投研,其策略风格可能最终更加稳定,因为大模型最后学习出的主要策略特征会趋同,整个市场的训练集是趋同的。如果大家的策略都能变为相对中长期的策略,长期来看这对于资本市场的稳定发展是有好处的。







请到「今天看啥」查看全文