导读
近来,大模型技术的发展与革新为金融行业持续提升生产力注入了新的活力。本期,我们将聚焦于金融报告撰写这一具体且对金融专业性要求极高的任务场景,共同探讨大模型在该种作业活动中的应用现状以及所面临挑战。
1.
大模型在金融报告中的应用现状
2.
大模型驱动的智能金融报告撰写
3.
技术实现与挑战
4.
未来展望
分享嘉宾|
向俊夫
南京吾道知信信息技术有限公司
技术负责人
编辑整理|
宋禺
内容校对|李瑶
出品社区|
DataFun
01
大模型在金融报告中的应用现状
首先,我
们
通过以下三个细粒度的应用场景及相应案例,初步了解大模型在金融报告撰写活动中的赋能方式以及显著优势。
1.
数据处理与报告生成
基于大模型技术开发面向金融报告生成的系统,可使系统具备如下功能特性:
(1)
能够更加智能地处理撰写材料中所需的相关数据;
(2)
能够较好地理解复杂数据点以及可能带有复杂语义的结构化表格;
(3)
能够对数据以及金融报告的背景进行更为出色的总结;
(4)
所生成报告质量更高,具备更满意的准确性和前后内容一致性。
2.
文档智能问答
大模型的文档(含传统结构化文档、扫描件、PDF、Word 等)处理和文本生成能力为金融从业人员查阅、获取相关写作素材提供了极大的便利,通过人与系统之间的交互问答,使从业人员能够更专注于报告的撰写。
3.
财务报告审核
在财务报告审核方面,大模型技术的引入带来了以下新的优势:
(1)
可通过提供差异对比、勾稽校验、财务错误识别等功能,提升审计效率;
(2)
更有助于避免错别字、前后文语义不一致等文本性表达错误;
(3)
能够更大程度的规避潜在人为错误(如不恰当的模仿历史报告撰写方式)。
4.
共同特点及优势
结合上述案例,大模型在助力金融报告撰写任务中,已初步展现出如下特点及优势:
(1)
大模型在金融报告撰写场景中具有丰富的子应用场景;
(2)
更高效、可靠的金融文档处理能力,极大解放了人力并提高了工作效率;
(3)
更深入的数据处理能力,可为金融决策提供更为全面的支持。
02
大模型驱动的智能金融报告撰写
接着,我们来探讨,为能使大模型在金融报告智能撰写过程中真正发挥其独特价值,必须要重点关注的几个问题层面,特别是从功能实现和应用的角度考虑。
1. ⽂本⽣成
首先,文本生成是大模型的基础能力,其质量关乎所撰写金融报告的可读性和阅读感受。因此,为完善大模型在该任务场景中的文本生成能力,我们可能会从如下两个角度进行切入。
(1)
基于内部数据库和⽤户需求,⽣成⾼质量分析性段落。譬如针对财务报告、市场情况等具体对象的专业化分析。
(2)
鉴于大模型是基于当前已有数据训练得到,存在一定的知识延后风险,因此在金融报告智能化撰写任务中,必须关注如何提高大模型对用户反馈的实时调整能力,以提高报告内容的可用性和个性化。
2.
⽂档质量校验
其次,鉴于金融行业的强监管特性,为保障金融报告的准确性、规范性,在文档质量校验方面,可关注大模型在以下细粒度场景中的表现:
-
数值冲突——⾃动⽐对不同部分的数据是否⼀致,避免信息⽭盾;
-
公式计算错误——精确校验勾稽关系,验证数据准确性,不需要依赖统⼀⽂本格式;
(针对以上两点,受限于当前大模型的学习能力,可能需要依赖 Agent 智能体赋予大模型在数据提取、生成文本过程中调用外部函数或服务的能力,即 function
calling。)
-
合规问题——⽐对⾏业规范与监管条⽂,确保⽂本表述是否有关键内容缺失或其他合规性问题;
(2)
⽂本纠错能⼒,识别并提示错别字、标点错误、语法错误、不严谨表达等,提升⽂档的专业性和可读性;
(3)
溯源⾄原始数据源或⽂档底稿,帮助⽤户迅速定位错误点,⼤⼤缩短了问题排查与修正的时间。
3.
数据解析与处理
第三,鉴于该场景中金融报告是通过类似人机交互的方式生成的,因此,为提高大模型对从业人员撰写需求的理解能力,在数据解析与处理方面,可考虑从以下四个方面着手:
(1)
构造 Prompt 对各类⾦融公告进⾏智能解析,确保关键数据和信息被准确⽆误地提取出来;
(2)
⾃动对采集数据进⾏清洗和标准化处理,解决数据格式不统⼀、存在错误字符、字段缺失等问题;
(3)
即时对数据进⾏标签化处理,如“营收增⻓”、“净利润率”、“项⽬赛道”等标签,极⼤便利后续的数据分析与应⽤;
(4)
⽀持定制化解析策略,根据实际需求调整解析规则,以适应不同类型的⾦融公告或特定的数据提取需求。
03
技术实现与挑战
本节主要介绍从产品、应用设想萌生到最终落地的过程,现阶段仍存在的一些挑战及应对策略,具体从模型选择和模型应用两方面展开。
1.
模型选择
(1)
挑战:如何在大模型能力、金融机构可支配资源和安全性之间取得相对满意的平衡?
第一,高性能模型如 GPT-4 能够提供卓越的能力,但资源消耗巨大;
第二,本地化模型资源消耗相对较低,但能力有限,如何在计算资源与模型能力之间进行取舍,仍有待深入探讨;
第三,在线 API 模型容易部署,但出于监管要求以及金融机构内部数据安全性考虑,该方式不可行;
第四,本地小规模化模型成本较低,但由于存在能力上限,如借助 Agent 智能体、RAG 和模型微调等技术提高模型的应用表现,仍需要专门化团队长期跟进。
(2)
应对策略:本地化部署
大模型本地化部署不仅能有效满足金融行业对合规性和数据安全的要求,且颇具开放性的应用部署过程为之实现定制化开发提供了极大的便利,具体的,目前存在以下两种搭建思路。
①
采取自研方式,完整的经历数据收集、大模型预训练(pre-train)、监督微调(SFT)等过程,但金融机构需要考虑自身能力及经济回报;
②
采用基于开源模型的开发方式(是当前相对主流的选择)。
2.
模型应用
-
大模型的公开评测表现与具体任务场景中的测试表现极有可能存在较大落差,因此在解决具体问题过程中,需要进行大量测试(如模型场景化测试、Prompt交互顺序调整等)以保障落地应用的实用性和可靠性;
-
大模型的黑箱问题,向决策者提供更直白的决策辅助信息;
-
大模型可能因训练数据不足导致对领域知识理解能力不够,进而无法满足真实应用场景需求
-
大模型所掌握知识、信息的时效性对金融报告智能撰写的影响巨大,需要在持续更新维护过程中,实现对维护成本的有效控制并提升对技术挑战的解决能力
(2)
在金融业务场景大模型实际落地过程中,目前较常采用的技术模式有以下五种:
-
提示词工程(Prompt Engineering),在金融报告撰写任务中,良好的提示词设计能够使大模型准确提取所需字段;
-
检索增强生成(Retrieval Augment Generation),该技术能有效提升大模型生成时效性、专业性高的分析性文本;
-
微调(Fine-tuning),针对一些特殊的细粒度任务场景,Prompt 工程可能无法提供预期效果,此时就需要借助历史任务所积累信息(如问答数据、处理经验等)对大模型进行微调,以提升其对特定任务的处理能力;
-
继续预训练,对于一些更具金融专业性要求(如涉及历史发行报告、监管规则、规范性文档等)的场景,可能就需要采用继续预训练的技术手段,投过投入相关文档,增强大模型的专业能力。但需要注意的是,采取该技术手段会消耗一定的时间和人力成本,而且不保证能在相关任务场景中取得预期效果;
-
纯自研,对研发公司的体量和技术、资金能力要求极高。
3. 大模型在金融报告智能撰写中的优势
在大模型出现之前,金融报告智能撰写的实现方式大致分为模板化写作、规则驱动的自然语言生成和统计语言模型三种。相较于这几类相对成熟的方法,大模型的应用优势体现如下:
(1)
在
标准化模板写作任务中,大模型克服了标准化模板配置、更新维护的繁琐性。对太过复杂而难以通过规则进行有效配置的局部场景,具有更强大的处理和适配能力,能有效改善大模型落地应用的灵活性。此外,大模型的应用赋予所生成文本更突出的流畅性。
(2)
与规则驱动的自然语言生成方法相比,大模型在文本理解、生成方面具备的先天优势,极大简化了文本的生成过程,并在一定程度上有效规避了相似表达的套路化。
(3)
与 NLP 经典自然语言处理技术相比,大模型的应用一是能够降低对人工标注数据的巨大依赖;二是具备更强大的文本学习能力,对上下文的理解能力更突出。三是大模型还能够将多任务集成在一个模型中完成,避免了训练多个针对性模型的繁琐性。
04
未来展望
最后,结合上述分享,我们对大模型在金融报告智能撰写场景中应用的未来发展有如下展望。
1. 多模态数据融合
在金融场景
中,
原始数据并不以单一的文字呈现,还可能以图片、扫描件的形式存储。而当前,我们在表达大模型这一概念时,通常默认为 Large Language Model 大语言模型,这是基于纯文本的模型。因此,在未来某个阶段,如何基于多模态技术,提升大模型的多源数据处理能力以及多文件格式输出能力,值得进一步关注。
2. 个性化与智能化
在金融行业,考虑到从业人员的经验、能力差异,以及不同任务不同阶段的差异化目标,就有必要使垂直领域大模型在人机交互过程中提供更具个性化、智能化的输出,从而满足差异化需求。
3. 持续优化与创新
从技术角度,在提升大模型性能的同时,缩减模型规模、降低计算资源占用已经成当前热门话题。在不久的未来,个人电脑或手机上能否部署足够强大的模型,通过更便捷的方式助力从业人员工作效率提升,值得我们共同期待。