议题主持人:党宏雷 某行软件开发中心 架构师
人工智能作为新一轮科技革命和产业变革的核心驱动力,其高质量与高水平的应用被视为推动金融领域向更高质量发展注入的新动能。随着大数据的持续深化发展,打造智能化应用及构建针对金融行业的专业大模型已逐步成为该行业发展的关键趋势。当前,人工智能大模型技术正处于快速迭代阶段,新技术和新应用不断涌现,为金融行业带来了前所未有的创新机遇。金融机构凭借其扎实的信息化基础和丰富的数据资源,可以借助大模型技术的持续进步,实现在管理效率、服务水平、产品创新等多领域的显著提升。在此基础上,通过社区平台的深入研讨,探讨金融企业如何在确保监管合规和数据安全的基础上,有效融合并利用线上大模型的最新技术,有助于为金融企业大模型应用建设提供思路和借鉴。
王瑜 某证券公司 算法工程师:
证券行业的大语言模型,在行业出现可供各企业应用的行业大模型服务出现之前,是一定要私有化部署的,这样可以保证公司内数据在公司私有环境内。对于大部分中小型证券公司来说,GPU算力很少或没有,进行模型训练基本不太实际。而且当前大模型发展迅速,基本每3个月都会有模型水平的大幅提升,证券公司与其自己训练模型,不如使用好当前业界最新模型。所以通过公司内部知识库挂载和Prompt相结合方式,基本能解决90%以上业务场景问题。即使进行了微调,所耗费的资源与模型效果提升的性价比也有限。所以,证券公司专注好已有业界最新大模型成果应用,与自身业务场景相结合,私有化部署进行模型推理服务,是当前在符合监管数据安全前提下,大模型应用的最优路径。刘艳春 某金融公司 架构师:
首先,对接大模型应用环境为私有化部署模式。对敏感信息按照中华人民共和国金融行业标准、个人金融信息保护技术规范等使用自动化数据脱敏工具进行脱敏并完成人工核验。对需要使用的数据进行安全分级分类、数据加密及访问授权等,并制定对应的权限。最后,依据各自职能分工完成数据存储、提取、传输、加密交付等。
其次,对整体模型调用数据建立数据平台入湖或业务存档等方式,以只读方式或从指定数据平台订阅数据,数据管理方面应具备可追溯,可审计原则,存有数据库日志记录,对接自有知识库。
再次,对于传输链路建议采用专线或VPN等技术确保传输安全。苟志龙 某股份制银行 高级工程师:
1.提供数据安全保障措施:数据分类分级,制定保护策略;数据加密,确保传输和存储安全;访问控制与权限管理,防止异常访问;数据脱敏与去标识化,保护隐私;安全隔离与网络防护,防止外部攻击。
2.构建符合专业场景的大模型应用:定制化模型训练,适应金融领域;模型优化与调整,提高性能效果;模型验证与评估,确保合规性;建立模型风险管理机制,应对潜在风险。
3.兼顾线上大模型服务的易用性和性能:开发易用的API接口,方便集成;优化模型推理性能,提高处理速度;建立高效的数据缓存机制,减少时间开销;持续监控与性能优化,确保稳定性。
4.与监管机构合作与沟通:积极参与监管政策制定,提供建议;建立监管合规报告机制,保持合规状态;与监管机构进行技术合作,推动创新发展。
此方案框架有利于保障数据安全,构建专业大模型应用,兼顾易用性和性能,通过与监管机构合作,实现可持续发展。李双宏 某证券公司 AI算法工程师:
大模型在训练、推理等环节有数据泄露的风险(包括公司内部的商业机密、用户的个人隐私数据等)。此外,在某些金融场景中的跨境数据流通问题也较为敏感。因此,金融公司应建立完善的数据管理和治理机制,确保高质量、有合规授权的数据,以有组织的方式投入到大模型的开发和部署过程中,从而保障数据安全性,避免触及合规红线。金融公司在保障线上大模型服务应用的监管数据安全方面可采取以下措施:
1.本地化部署:金融公司普遍采用本地化部署的方式,从而有选择地使用私有数据和公开数据训练大模型,这有利于保证了数据和模型的安全风险得到有效控制。
2.数据脱敏与加密:对于线上个人信息,按照金融行业标准使用自动化数据脱敏工具进行脱敏处理。同时,对大模型使用的数据进行安全分级分类、数据加密及访问授权等,确保数据存储、提取、传输、加密交付和删除的安全性。经过脱敏且符合合规要求的数据可以利用最新的线上大模型,从而在一定程度上提升用户体验,摆脱本地化部署大模型更新迭代速度较慢的束缚。
3.访问控制与权限管理:大模型的使用需要实施严格的访问控制和权限管理,确保只有授权人员可以访问敏感数据,并限制不同人员对数据的访问和使用。金海波 昆仑银行 数据架构师:
金融企业在大模型建设过程中,为了满足监管要求保障数据安全,可以采取以下措施:
1.大模型的训练和推理环境需要私有化部署;
2.对于行业通用类的数据可以通过采购方式获取,在行内私有环境进行使用;
3.按照金融行业监管要求按照影响进行数据分类分级管理,对不同级别数据采用相匹配的管控手段;
4.在大模型训练中需要使用的敏感数据,在不影响使用效果的评估下进行脱敏处理;
5.建立严格的访问控制机制,只有经过授权的人员能够访问特定级别的数据;
6.建立的大模型安全性和合规性评估,定期进行评估,确保其不会导致数据泄露风险。maolala 某银行 系统分析师:
在金融机构中使用大模型时,必须兼顾数据隐私、合规性以及最新大模型服务的易用性和性能。需要企业对数据进行处理及审计,实际上从数据层面来讲大模型应用的数据安全和传统数据安全差别不大,训练推理使用的数据做好处理和隔离应该就能满足相关安全需求:
1.数据脱敏和匿名化
数据脱敏:对个人身份信息(PII)进行脱敏处理,确保敏感信息在处理过程中不可识别。例如,将真实姓名、地址等信息进行掩码处理。
数据匿名化:使用技术手段对数据进行匿名化,使得数据无法与个人直接关联。
2.数据隔离和安全存储
数据隔离:将敏感数据与非敏感数据隔离存储,确保敏感数据仅在必要时使用,并且仅授权人员可以访问。
加密存储:对存储的敏感数据进行加密,确保即使数据泄露,未经授权的人员也无法读取。
3.使用隐私保护计算技术
同态加密:允许在加密数据上执行计算,使得数据在计算过程中始终保持加密状态。
安全多方计算(MPC):在多个参与方之间分割数据,确保单个参与方无法获取完整数据。
差分隐私:在数据中加入噪声,确保数据的统计特性不会泄露个体信息。
4.建立安全的模型训练和推理环境
本地训练和推理:在本地数据中心或私有云中进行模型训练和推理,避免将敏感数据上传至公共云服务。
边缘计算:在数据生成的地方进行计算,减少数据传输的风险。
5.选择合规的大模型服务
合规认证:选择通过金融行业合规认证的大模型服务供应商,确保其符合相关法规和标准。
服务协议:与供应商签订严格的数据使用协议,明确数据隐私和安全责任。对敏感数据安全性要求较高的强要求服务全过程私有化部署。
6.监督和审计
定期审计:对大模型的使用情况进行定期审计,确保其符合安全和合规要求。
随着大模型技术的不断演进,其在金融领域的应用日益广泛。从智能营销、信贷评估,到财富管理和风险控制等多元领域,大模型正为金融行业注入前所未有的活力和动力,助推金融行业的数字化与智能化转型。为了充分利用金融机构已 有的数据优势,并结合金融业务的多样化场景,同时在确保监管合规与数据安全的前提下,提供对大模型的高质量数据供给的同时,能够持续跟进最新的AI技术, 兼顾良好的性能和实用性 。经过多位专家深入探讨,形成以下共识:私有化部署:鉴于数据和模型的安全性考虑,建议金融企业普遍采用私有化部署方案,以确保敏感数据在私有的内部网络环境中处理和使用。
数据脱敏与加密:对敏感信息进行脱敏处理和人工核验,并遵循金融行业的标准对数据进行严格加密,从而确保数据在存储、检索和传输等环节的安全。
访问控制与权限管理:执行严格的访问控制和权限管理策略,确保只有经过授权的人员才能访问敏感数据,并对不同人员的数据访问和使用权限进行限制。
数据分类分级管理:按照金融行业的监管要求,实行数据的分类分级管理,并根据不同级别的数据采取相应的管控措施。
建立合规性评估机制:定期开展大模型的安全性和合规性评估工作,以降低数据泄露的风险。
技术合作与政策参与:与监管机构建立技术合作关系,积极参与监管政策的制定过程,旨在推动创新发展的同时,确保业务的合规性。
以上措施将有助于为金融企业构建一个能够保障数据安全的同时,促进大模型应用发展的实践思路与方向 。
点击文末阅读原文,可以到社区原文下留言交流
觉得本文有用,请转发、点赞或点击“在看”,让更多同行看到