又到年审了,
各项目组应该都抢完实习生了,
假如你也遇到这样的场景:
那么今天我们将介绍,如果利用
SW审计工具箱
,
针对合同录入的这个单一场景,
少费一点实习生,让他们保留一点对审计的好感。
运行工具箱
我们在工具箱中双击“文本文件关键信息提取”功能,
我们先点击“填写数据”,会自动打开一个Excel 配置表,我们进行参数配置。
配置完成后,我们保存Excel, 再点击“开始运行”,
待生成完成后,再点击“查看结果”,找到生成的文件。
配置表的填写
需要知道的是,工具是调用的目前国内最强的AI 大模型 deepseek v3 去提取文件中的关键信息。
我们需要填写的配置表如下:
整体来看,我们需要执行以下几个步骤:
将PDF转换成 txt 文件
出于节约钱的角度,我们不用大模型去作 ocr 转换。
你可以找一个能够 ocr 的工具(很多PDF软件都有这个功能),
批量将所有你需要处理的 pdf 转换成 txt 文件,
保存在一个文件夹下(可以多层级存放),
这个文件夹路径就是配置表中需要填写的“处理文件夹”路径。
获取 deepseek 的 api_key
这里我们由于需要调用 deepseek 大模型的 api 接口,
因此我们需要按照操作说明(配置表Excel 里有)进行注册,
拿到 api_key 。
这个过程不复杂,大概1-2 分钟就可以完成。
当然,你是需要去充值的(最低 10 元,个人可能都用不完),
但是它的接口调用费用非常低(目前每百万token是2元,1个汉字大约是1个token),
我测试下来,对于一份 4-5 页的合同,跑了44 份,花费了 0.1 元。
可以看出这个费用是非常低的,
这样的合同跑 1000 份,也就差不多 2-3 元钱。
填写 system prompt
配置表里填写“system prompt",
比如:我已经填写好了:
❝