目前,机器学习和深度学习技术已在内部审计领域得到较为落地和成熟的应用。机器学习已被应用于内部审计数据建模,其数据处理、模式识别、异常检测、分析预测等特性,能够帮助内审人员更有效地识别风险和发现潜在的不当行为,成为传统专家规则类审计模型的有益补充。
传统审计模型通常由审计人员根据典型审计案例,总结舞弊和不合规行为规律,并将规律转化为程序运行规则。而基于机器学习的人工智能审计模型则依靠计算机算法的自主学习,通过对大量数据的学习,发掘数据中隐含的规则,并形成审计模型。在这一过程中,计算机在一定程度上代替了人工进行归纳总结。现阶段,机器学习算法训练的模型需要与传统模型结合使用,由机器学习算法模型产出对未来数值的预测、对被审计对象的基本判断以及根据数据特征对被审计对象划分不同的群组,再由凝结审计人员大量确定性经验的模型进行筛选,最终交由审计人员进行最终审计问题的查证确认。以舞弊审计为例,随着舞弊手段的升级和舞弊场景的复杂化,传统的审计模型由于逻辑固化,往往难以对人员常态化行为进行有效监测和风险评估。引入机器学习模型,通过对员工基本信息、账务信息、信用信息等数据的分析,可以对人员行为进行多维度、多视角监测,并与业务审计发现的问题进行融合分析,挖掘违规事项背后的人为因素,实现人、事一体化分析,从而全面了解问题和风险成因,提出更有针对性的审计建议。
深度学习技术能够有效处理和分析审计领域积累的大量非结构化数据,帮助审计人员从海量非结构化数据中发掘疑点线索。利用自然语言处理、计算机视觉等深度学习技术对文本、图片、语音、视频进行结构化处理,打造智能化工具,并将处理结果与财务、采购、业务等其他领域的结构化数据比对,形成审计疑点线索。
在文本识别方面,
利用深度学习技术可以对合同文本、票据、审计报告等文档中审计人员关注的信息进行提取,形成结构化数据表用于审计分析。例如在合同审计中,可以利用文本解析技术自动提取合同文本要素,如合同名称、合同状态等,并进行批量结构化信息识别、抽取,再与外部工商信息库、内部采购及财务系统中数据进行比对和建模,从而发现审计疑点,提升审计人员翻阅文件发现线索的效率和覆盖面。此外,还可以利用文本识别技术对多文本内容相似度进行对比,甄别文件内容高度相似等问题。如在招投标文件审计场景中,通过对文档的结构化处理,可以自动实施相似度比对,在短时间内完成对一个标段全部投标人之间的技术标两两比对,并将相似度高的章节段落突出展示给审计人员,一遍其进一步判别。
在图像识别方面,
利用深度学习技术可以完成图像篡改检测、图像相似度比对、图像信息提取等多类型图像处理任务。针对识别相似图片造假审计场景,可以利用神经网络提取大批量图片特征,采用余弦相似度计算两两差异,将差异较小的图片作为虚假嫌疑对象,产出审计线索供审计人员进一步查证。
在语音识别方面,
该项技术在会议录音转文字、情感分析定位员工、客户异常定位等审计场景中已经成熟应用。例如在客户服务质量审计中,可以对客服语音进行情感分析,并提取预定义的风险关键词,再与服务工单等进行融合分析,从而识别服务质量以及业务领域违规风险线索。