刘新海:
资深人工智能专家,某金融联合实验室首席研究员,在世界一流的AI实验室获得博士学位,曾担任北京大学金融智能研究中心主任助理,并且从北京大学成功孵化出AI团队。
主持人:柏亮 零壹智库CEO
1、DeepSeek带来技术普惠,中小金融机构部署AI压力大减,同时带来全球 AI 的良性竞争。
柏亮
:
请两位老师从金融应用视角、行业市场等方面,谈谈 DeepSeek 带来了哪些变化。我们又该如何适应和调整呢?
谢国忠:
DeepSeek具有低成本、高性能和开源的特点,这带来了技术普惠,深刻影响了应用变革。对金融行业而言,这种变革主要体现在亲民化、平民化、普及化三个方面。首先,是应用的亲民化,中小金融机构也能应用大模型。过去,大模型价格高昂,让人望而却步。但 DeepSeek 出现后,推动了千行百业快速部署和应用大模型,金融机构也不例外。
很多在金融机构负责数据业务的朋友告诉我,在大模型出现及应用兴起时,中小金融机构非常焦虑。因为按照监管要求,大模型部署必须私有化(本地化部署),这就意味着中小金融机构不仅要购买 GPU 算力,还要购买大模型的许可和软件,同时还需配备高水平的专业人才,负担非常沉重。而 DeepSeek 价格便宜且开源,使得部署压力大大减轻。
在DeepSeek 出现之前,AI 应用长期被巨头、大厂和大型金融机构垄断,现在逐步过渡到全民可部署、可开发阶段。如此一来,AI 应用不再高高在上,逐渐走向亲民化,这对中小金融机构意义非凡。
第二,是应用的平民化,金融行业从业人员和普通百姓都能使用。因为 DeepSeek 是一个推理模型,其思维方式与人类相近,并且免费,普通老百姓会用,也喜欢用,这促进了AI 平民化。就拿我自己来说,之前在手机上下载了豆包,后来又下载了 kimi。这几种模型各有特色,普通老百姓都能轻松使用。
第三,是端侧应用的普及化。小参数模型通过蒸馏技术变小后,未来可以适配于各类端侧设备,比如手机、平板电脑、可穿戴设备、智能眼镜、智能家居、具身机器人等边缘设备都可以部署。
AI 在端侧的应用想象空间巨大,比如保险公司建立了很多康养社区,关注大健康和老人护理。如果在康养社区里部署能走路、能思考、能做动作的具身机器人,再灌入大模型后使其具备交流能力,能给老人提供建议、讲笑话,还能实时离线服务,效果跟真人差不多,这极有可能带动一个产业的发展。
柏亮:
请刘老师聊一下您这段时间观测或体验到的与DeepSeek有关的新变化,您觉得最大的变化是什么?
刘新海:
我主要从三个方面说说它的优势和独特之处。
一,DeepSeek 在工程应用上的创新,大幅降低了推理模型的成本。这种创新不是技术方面的,而是把目前很多 AI 大模型最先进的技术,比如 MOE 架构、自动强化学习进行整合,做了很多工程上的优化。
推理模型跟前几年 OPEN AI 推出的生成式(Generative)模型不同,后者主要是生成新的文本、图像、音频,依据是数据的分布;而推理(Reasoning)模型则更类似于人,经过逻辑推理思考,去解决复杂问题,进而提高模型的智能化水平。
第二,就像谢总所说,DeepSeek带来 AI 大模型的亲民化和群众普及。国内很多人春节的时候就开始用 DeepSeek 做对联,拜年等,特别是一些老龄人士,Deep Seek让AI的上手门槛很低,只要有基本认知能力的人都能玩 AI 了。DeepSeek不仅在企业端普及,在消费者群体中的普及程度也很高;不仅在中国,在印度等新兴市场国家,其下载量也很惊人。现在 DeepSeek 的全球下载量已经超出了 ChatGPT,这是非常好的 AI 普及教育。
第三,DeepSeek 带来全球 AI 的良性竞争,打破了美国硅谷的 AI 垄断。科技进步是不断迭代和优化的过程,AI 大模型时代技术的后发优势明显。如果赶不上这一波,还可以赶下一波,DeepSeek 未来也可能被更具创新的其他AI公司超越,这是行业发展的必然趋势。
最近,得益于 DeepSeek 带来的活力,DeepSeek开源,将很多技术细节公布于众,有利于行业的迭代优化,OpenAI 的垄断地位被打破,整个领域取得了很多新进展,很多全球大模型厂商都在不断推出更好、更便宜、更有潜力的大模型服务和产品。这是一个激动人心的时代,让基于 AI 的第四次工业革命可以继续推进。
最近图灵奖得主杨立昆在领英上说,某些圈子存在错位的优越感,喜欢小圈子垄断所有好生意。虽然DeepSeek 也遭到一些网络攻击,但整体来说,它带来全球 AI 的良性竞争,激发了创意创新的活力。
2、DeepSeek在金融C端应用尚处于探索期,B端却有众多易落地场景,涵盖智能客服、营销助手、智能投顾、量化交易助手、投研市场分析等多个领域。
柏亮:
结合现在金融业端侧的线上线下影响,具体有哪些方面的应用可能会因为 DeepSeek 产生变化?
谢国忠:
端侧应用目前还在想象阶段。小参数模型通过蒸馏适配到手机端、PC 端、ATM 等还在进行中,但这无疑是未来的发展趋势。
我觉得可能要分两步走,第一步是在金融机构内部人员的 ipad、手机上应用,先在内部使用起来;第二步再面向最终客户。因为金融机构还面临很多问题,例如大模型现在还有幻觉问题,如果没有解决就直接推到用户端,会有安全和监管方面的风险。
所以现在大家还在探索过程中,方向是明确的,但可能要分两个阶段。目前银行内部可以先利用这个技术,等条件成熟,幻觉问题得到控制、监管放松后,金融机构直接面客场景也可以使用大模型。
柏亮:
像银行的智能网点,里面的智能设备呢?
谢国忠:
网点的摄像头、签到、双录等设备可以利用起来,改善智能对话,还可以给客户一些产品推荐。但最终用户侧的设备大模型应用可能在第二个阶段。
柏亮:现在很多大一点的银行数字化做得比较好,在智能化应用上已经有一定成果,DeepSeek 会给银行、保险、证券等金融业现有的应用带来哪些变化呢?
谢国忠:金融机构在 AI 应用领域有很好的基础, 20 多年前就有部分 AI 应用。DeepSeek有其独特之处,它可以处理大量文本数据,帮助生成交易策略,分析历史数据并预测未来趋势,还能自动生成报告。DeepSeek在金融行业有很多容易落地的场景,我大概总结了九个:
第一,智能客服。目前在金融机构落地最多的是智能客服领域,大语言模型能够支持多人对话、语义理解和情感智能分析,就可以帮助金融机构提升和改善服务质量。现在很多大模型应用都集中在智能客服上,因为大语言模型可以交流、做文本分析,这是目前金融机构最重要的应用之一。
第二,营销助手。利用大模型强大的语言处理和交互能力,对接金融机构业务系统,构建知识图谱,以自然语言方式为理财顾问、销售经理提供知识服务。但它只是助手,不能代替核心业务,很多商业银行都有这种应用。
第三,智能投顾。证券、银行等金融机构利用大模型强大的自然语言处理能力和高性能推理能力,能更准确理解客户意图,挖掘潜在需求,连接后台业务系统进行产品推荐。
第四,量化交易助手。DeepSeek 可以协助量化投资与交易,通过文本处理、互联网搜索洞察市场情绪,构建情绪因子辅助交易决策,实时监测政策变化、企业公告等事件,通过语义理解触发自动交易信号,还能挖掘关联因子优化量化模型。
第五,投研市场分析。DeepSeek 可以进行信息检索、文档处理、行业研究和趋势研判,帮助撰写投研报告。这是证券行业广泛应用的场景之一。
第六,语音质检。金融机构的保险公司、银行等有很多客服接电话,原来通过双录(录音和录像),把语音转成文本,再依据预定的关键词、敏感词或规则来判断话务员是否违规,这就是语音质检。现在有了大模型,语音质检可以重构,因为大模型对自然语言处理、上下文理解以及关键词筛选更准确,效果更好,是金融机构客服语音质检能快速落地的重要场景。
第七,风险评估。DeepSeek 可以连接后台数据库,整合客户多维数据,分析非结构化数据,构建更精准的风险评估模型,对客户信用风险、市场风险进行更精准评估,助力风控工作,原有风控模型也能借此进一步增强。
第八,运营管理。DeepSeek 具备代码编写等功能,金融科技公司和银行可以利用它进行内部 AI 办公,构建内部知识库,用于智能客服和中台运营管理,提高员工生产力和工作效率。
第九,合规管理。很多金融机构要做信息披露,DeepSeek 可以帮助进行文件检查、制度解答、非结构化数据核对,确保符合监管要求。
但DeepSeek也不是万能的,在原有机构的一些核心业务领域,它还难以介入,主要能力还是在文本内容生成方面。这九个大场景是最容易落地、增强、优化和重构的,这是我的理解。
柏亮:
有观众提问,我们使用银行 APP 客服时,经常很难得到正确答案,最终不得不呼唤人工服务。DeepSeek 会对这类服务有较大改进吗?
谢国忠:
应该会有改进。原来的智能客服是把问题和答案预先灌在知识库中,如果问题不在预设范围内就无法回答。有了 DeepSeek 这种大模型后,情况会有所不同。它不仅可以理解语义和上下文,还会把知识库内容灌进去构建知识图谱,同时进行语义理解和智能对话。而且它知识面广,回答会更流畅、更准确,未来在语义理解和客户服务方面会有很大提升。原来的智能客服受限于预设范围,现在的大模型可以在更大范围内理解文本和语言,还能联网搜索,信息范围和内容更广更准确。
柏亮:
刘老师在数据征信风控领域经验丰富,DeepSeek 带来的变革对这些领域有很大改变吗?现在是否已经开始落地应用?
刘新海:
先补充一下刚才谢总说的客服问题。客服在金融领域很重要,一直在探索改进。我经常遇到有人问征信和信贷问题,用 DeepSeek 等大模型回答会轻松很多,能给出 60% - 70% 准确或有用的信息。
当然,大模型回答也存在不够准确的问题,但它至少能节省一部分人力工作,目前的初期可以采用人机协作的模式。比如,简单的问题由机器回答,复杂的问题让人来回答。相比之前,一个客服可以同时处理多个问题的接待,特别是在征信和信贷问题处理上。这不仅能节省人力,还能提升服务质量,是很好的应用场景。
再讲讲其他变革和影响,主要有三点。
第一,金融领域是 AI 最好的应用场景之一,数字化程度高,IT 和业务相对标准清晰,金融机构也愿意为有效果的技术买单。从历史上看,先进技术往往先在金融领域应用。在金融领域的各个环节,包括银行、证券、保险、理财、信托等,都会用到 AI,都会因 AI 发生改变。
DeepSeek 和其他AI 大模型就像操作系统,不能单一完成目前的工作,还需要具体的软件和中间件来构建生态,每个环节都要进行 AI 改造和流程优化,使其标准化。比如,在我们团队,研究助理往往把工作流程化后,研发团队就可以用 DeepSeek 的模型实现自动化。目前,围绕AI大模型,有很多现成的软件和解决方案,但这是一个生态系统,不能只依赖大模型解决所有实际问题。
第二,金融细分领域在对 AI大模型的应用情况不同,差别很大。银行信贷是 AI 应用最广泛的领域,场景丰富、规模大、市场主体多,但监管问题也多;证券是 AI 应用最深入的领域,算法交易很早就开始应用,量化基金也有很好的应用场景(例如Deep Seek的母公司幻方科技就是一个量化投资公司);保险是 AI 应用最具潜力的领域,虽然数字化进展相对较慢,但未来后发优势会很明显。
第三,AI 在金融领域的应用可以分为三个层次:第一个层次提高工作效率,目前 DeepSeek 在这方面有进展,在金融研发、管理、业务等方面都有多种用法;第二个层次是改善产品和服务,这不仅需要深入理解业务,还涉及数据隐私、合规、伦理等问题;第三个层次是打造新的商业模式,这非常难,需要在熟练应用 AI、提高效率、改善产品服务、技术进步以及用户增多、理解加深等多方面条件成熟后才有可能实现。
目前 AI 虽然发展不错,但在金融领域目前还没有出现爆款产品,像自动驾驶、用 AI 研究蛋白质等领域那样的爆款应用。AI 在金融领域主要还是处于提升工作效率的阶段,其他方面还需要时间积累和深入应用来推进。
3、DeepSeek 的推理模型达到中等专家水平,可承担大量基础重复性工作,但很难替代高级、顶尖研究员和专业审计员。
柏亮:
谢谢刘老师,给出了一个理解和展望 DeepSeek 应用的框架。最基础的层次是提高效率。有观众问,用大模型做行研效果怎么样?会不会快速替代行业研究员?
刘新海:
中低水平的行业研究员被替代的概率比较高。目前AI大模型测试结果显示,DeepSeek 的推理模型基本达到中等专家水平的思考能力,初级行业研究员的工作基本可以被替代,但高级、顶尖的专家,大模型短时间内还很难替代。
谢国忠:
我原来有同事在大券商公司,他们正在部署相关大模型。做行业报告时,大模型可以完成 50% 以上的基础性工作,包括资料收集、分析等,能提高效率,在可靠性、全面性和深度方面都有很大提升,但目前还不能完全替代行业研究员。
柏亮:
马斯克用六个 AI 工程师在一个星期内就查出美国很多部门的账本,以前审计这些部门需要上千人的团队花费半年时间。这对审计行业是不是巨大的替代性冲击?尤其是 DeepSeek 这样的大模型应用后,审计、会计行业会不会受到很大影响?
谢国忠:
我觉得这么快查清楚账本,不太可能只用一个工具,可能是多种工具结合。大语言模型擅长处理文档、文件等非结构化数据,但审计工作除了处理非结构化数据,还需要对接原始数据库和交易记录,可能还会用到其他工具,如RPA机器人。
DeepSeek 这样的大模型有帮助,但不是单个模型就能解决所有问题,应该是多个工具整合才能达到这种效果。而且审计涉及很多原始资料和业务规则,实现起来并不简单。
刘新海:审计场景相比客服和行业研究更难替代。虽然 AI 可以提升审计效率,实现自动化重复性工作,优化风险评估和合规检查,但审计工作需要专业判断和解释能力,AI 在这方面还存在不足,对背景的理解也有限。比如让 AI 写一些重要工作会议总结,由于对会议背景缺乏足够的了解,效果往往不尽人意。所以 AI 完全替代审计工作的可能性较小。
4、随着 DeepSeek 的出现,个人征信的个性化服务将会兴起,市场潜力巨大。
柏亮:
有个和刘老师工作相关的问题,很多观众问征信方面,大模型能不能起到效果?
刘新海:
先说企业征信,企业征信的数据源很多是公开的,数据库有时也可开放。企业征信的基本版报告,我认为大模型基本都能自动化搞定,这样可以让征信机构的工作人员可以去深入现场调查,进行更具体的分类和细化工作。
再看个人征信,未来大模型在信用评分方面会有很大作用。目前开发信用评分的周期长、成本高,但用 DeepSeek 这类大模型,从数据处理、建模到分析,速度会非常快,能降本增效。
此外,大模型还能直接处理非结构化的大数据,以往我们需要把非结构化数据处理成结构化数据,现在可以直接将非结构化数据输入到大模型进行处理。而且,大模型在欺诈模式识别方面,其非监督学习能力很强,目前应用效果非常好。
还有一点,有了 DeepSeek 等 AI 大模型后,个性化服务成为可能。我们可以设想把个人征信报告上传到类似DeepSeek这样的模型里,或者通过AI中间软件/信用助理软件,就能自动分析个人信用情况,查看是否存在问题。
国内的信用体系和美国不同,美国有成熟的面向消费者的信用服务,有公开的信用评分产品,消费者能清楚了解自己的信用状况。国内个人征信服务还在起步阶段,面对个人信用报告有一百多项数据,消费者很难知道问题出在哪里。
现在,类似DeepSeek 这样的模型有望成为个人信用助理,未来 C 端个性化服务会越来越好。用户只需上传个人征信报告,模型就能分析出问题,还能根据个人情况给出贷款、理财和风险方面的建议。
我觉得这会开辟一个新市场。在中国,面向个人消费者的征信业务还有很大发展空间,美国征信市场这部分业务占比约 20%。随着 DeepSeek 的出现,个人征信的个性化服务将会兴起,市场潜力巨大。
我之前从事 AI 工作,后来回国进入央行征信中心,当时 AI 处于低谷期,但是大数据时代到来了,金融领域是大数据应用的丰富场景。
大数据面临诸多难题,数据量庞大且类型繁杂,包含电信、社保、公积金等多种来源的非结构化数据,与传统标准化、结构化的信贷数据差异很大,分析难度高,我自己的团队和相关专家也一直在探索基于大数据的相关信用评估模型。现在有了DeepSeek,这些基于大数据的金融信贷分析问题未来会得到很大改善。
其实,本次 AI 的重大进展,像 DeepSeek、ChatGPT 等模型的出现,都是因为数据量达到一定程度,技术进步,再加上模型模式的飞跃。这些模型的快速发展,很好地解决了大数据征信的问题,我认为这一领域发展空间巨大,能为征信行业的大数据应用带来新的活力。
谢国忠:
我还见到一个案例,国内某公司把和客户相关的征信报告拿到后,通过大语言模型进行解读,衍生出多个变量,并利用这些变量做风险模型。用大模型解读征信报告,对用户来说是个很好的途径,如果用 DeepSeek 可能会更简单。
柏亮:很多人认为用大模型处理征信难度较大,它更多的是个性化问题。但两位专家都比较乐观,一方面已有较多应用案例;另一方面大模型解决个性化问题的能力也在不断增强。
5、DeepSeek会大幅降低金融业数字化成本,缩小中小金融机构数字鸿沟,但人才培养和数据打通至关重要。
柏亮:
大银行或盈利好的银行数字化投入大、水平高,中小银行或其他金融机构存在 “数字化鸿沟”,因为资本、人才门槛高,投入困难。现在 DeepSeek 会不会大幅降低金融业数字化成本,缩小中小金融机构与大型金融机构在数字化和技术上的差距?
谢国忠:
肯定会的。中小金融机构以前根本不敢想象使用大模型,因为要购买英伟达的算力,哪怕买几个最基础的RTX4090,也是一笔不小的投入。比如,搭建一个企业版的 13B模型,成本也在百万级以上。而且,买了硬件和软件后,还需要专业人才进行部署、微调,并把内部的数据库导入进去才能使用,周期很长,技术也复杂。
对于中小银行来说,不仅部署困难,还缺乏相关人才,并且金融机构对数据安全要求高,不能使用云端服务,必须私有化部署,这对他们来说挑战极大。现在 DeepSeek 出来后,成本很低,部署推理模型所需的硬件资源和软件免费,开发也容易,确实实现了普惠,能在很大程度上拉平大型和小型金融机构的差距。当然,人才培养还是个问题,必须重视。
刘新海:
DeepSeek 确实给中小金融机构带来很多利好,技术门槛大幅降低,以前需要很厉害的专业人才,现在经过简单培训就能上手使用。但原料(数据)也很重要,大银行数据多、业务多,能基于这些数据进行建模,利用 DeepSeek 对产品和服务改进、打造商业模式更有优势。
所以,中小银行光靠 DeepSeek 还不够,还需要配套制度层面的改变,比如开放银行数据。不能让大机构垄断数据和技术,现在技术上的垄断有所打破,但数据也要打通,这非常重要。
6、DeepSeek 给金融科技公司带来冲击和机遇,创新、专业、精细化路线才是未来生存之道。
柏亮:
过去两年,中小型金融科技公司生存越来越困难,大模型研发投入大,真正投得起的公司较少。DeepSeek 出现,在人工智能赛道上,小的金融科技公司只要专业,利用低成本的开源大模型服务,有没有可能获得更多机会?
刘新海:
在金融科技领域,DeepSeek 的影响有利有弊。好处是金融科技公司的研发成本会降低,有了这个好工具,能更好地进行创新和技术迭代。但技术门槛降低后,很多金融机构可能自己就能完成一些技术工作,金融科技公司由于不能掌握业务和数据资源,也会受到冲击。
DeepSeek 让金融科技公司不用在技术研发上耗费过多精力,可以把重点放在金融业务理解上。大模型的跨学科能力很强,能帮助金融科技公司快速提升对金融业务的理解,在此基础上进行真正的创新和技术迭代。
这意味着金融科技公司如果想在未来生存,就要像欧美发达国家的金融科技公司一样,走创新、专业、精细化路线。现在国内很多金融科技公司以营销为主,业务杂而不精,缺乏优质的产品和服务。目前在美国,投资 AI 金融科技公司时,投资人会关注其性能是否比现有技术提升几倍以上,否则就不投资。
所以,DeepSeek 给金融科技公司带来冲击的同时,也带来了机遇,关键在于这些金融科技公司回归创新的本质。
谢国忠:
金融科技公司可以分为两类:一是各国有大行自己成立的金融科技公司,这是体制内的金融科技公司;还有一些民营企业性质的、非金融机构所属的金融科技公司。
体制内的金融科技公司在资源和数据上占有很大优势,比如招商银行,科技人员有一万多,搞人工智能和算法的就有 300 多,再加上外围人员,实力远超普通金融科技公司。目前,一些体制内的金融科技公司会对外赋能,帮助中小金融机构提升科技水平,这是个好方向。
体制外的金融科技公司生存空间相对艰难,一些大项目会被体制内的金融科技公司拿走。体制外的金融科技公司必须找到垂直领域的应用点,实现突破。当然也有例外,比如新网银行,规模较小,员工三四百人,其中 200 多人是科技人员,是科技驱动的金融机构,在大模型和算法方面走在前列。这取决于金融机构的基因以及对外部合力和生态的利用。
7、在解决500-1000万的银行对公业务方面,DeepSeek潜力很大。银行对公业务方面怎么运用 DeepSeek,两位有什么想法和经验?
谢国忠:
银行对公业务可能主要在信贷方面,利用 DeepSeek 进行背景调查、采集外部市场的非结构化资料,协助建模,在风控模型构建上也能发挥作用。
刘新海:
目前对公业务面临很多挑战,对公信贷主要依靠人工,因为企业情况复杂,不同规模、类型的企业差异大,不符合大数定理,信用风险建模比较困难。
但有了大模型后,可以进行精细化建模,针对不同企业建立多个定制化信用评级模型。其次对公业务涉及的数据多元化,非结构化数据也多,AI大模型可以自动采集和处理企业信息。
另外,企业风险维度多,传统建模方式难以应对,大模型能提供更多帮助,对公业务在大模型应用上后发优势明显。比如银行信贷经理主要处理 1000 万以上的信贷业务,500 万以下按小微企业用个人信用评分处理,500 万到 1000 万之间的对公业务比较尴尬,人工处理成本高,用信用评分风险大,大模型在解决这类问题上潜力很大,值得深入探讨。
8、DeepSeek会促进智能体发展,提升其数据处理能力,但最大的挑战在于监管和合规,尤其是个人数据的使用。
柏亮:
我们春节前采访一些金融科技、人工智能公司,大家都说 2025 年会大力发展智能体(agent)相关服务,智能体成为人工智能领域的热门话题。智能体在金融领域的应用会不会因为 DeepSeek 的工程性变革变得更容易、普及更快?
谢国忠:
智能体在金融机构中确实很重要。以前金融机构购买通用大模型后,会结合自身知识库文档进行微调。但银行是流程驱动的,仅靠大模型无法解决所有问题,需要智能体来串通业务流程。比如完成一个任务分十步,智能体可以连接银行内部各个系统以及外部系统或其他流程,从而完成整个作业。