专栏名称: 逆行的狗
不会编程的军人不是好的审计员
目录
相关文章推荐
51好读  ›  专栏  ›  逆行的狗

合同、财务报告关键信息提取

逆行的狗  · 公众号  · 互联网短视频 科技自媒体  · 2024-10-18 22:25

主要观点总结

文章介绍了一个开源的合同、财务报告关键信息提取项目,其用户友好的操作逻辑允许用户轻松提取PDF文档中的关键信息并导出为CSV文件。文章还提到了部署该项目的一些挑战,包括需要使用openai的key来调用大模型,以及修改成本地部署的大模型的api才能在本地运行。

关键观点总结

关键观点1: 用户友好的操作逻辑

该项目允许用户通过简单的步骤上传PDF文件,自定义添加需要提取的关键信息字段,并直接读取文档中的关键信息。用户不需要编写代码即可轻松完成操作。

关键观点2: 项目部署的挑战

该项目的部署稍微麻烦,需要使用docker部署或原码部署。在使用openai的key来调用大模型方面存在困难,如果没有openai的key,则无法成功使用。

关键观点3: 项目应用的前景

如果在会计师事务所等场景中部署该项目,审计人员可以自主上传合同PDF、添加所需字段和提示词,实现批量识别提取并输出成Excel文件,这将大大提高合同信息检查和纸质资料检查项目的效率。


正文

请到「今天看啥」查看全文


今天看到一个开源的合同、财务报告关键信息提取项目,

与其它开源项目相比,最大的特点就是用户友好的操作逻辑。

比如,我有一堆销售合同,可以把需要识别的合同PDF 都添加上来。

对于上传的 PDF 文件,可以自定义添加需要提取的关键信息字段(点击“加号”),

对于添加的字段,可以自己命名,写上“提示词”来描述你具体需要提取的内容。

这样它就可以直接读取 PDF 文档中的关键信息。

完成后,可以直接导出 CSV 文件:

这样的操作逻辑,其实对于一般的用户是非常友好的。也不需要编写代码去提取关键信息,很方便。

这个开源项目叫:knowledge-table

网址:https://github.com/whyhow-ai/knowledge-table?tab=readme-ov-file

部署稍微麻烦点,试了 docker 部署,我部署后使用不了。

然后用原码部署是成功了,但是配置文件中要使用 openai 的 key 来调用大模型。

我没有 openai 的 key ,所以也没有成功使用上。

如果修改成本地部署的大模型的 api 就能在本地跑起来了。

我是感觉这个项目的用户操作逻辑非常好,如果在会计师事务所中部署上的,

审计人员自己就可以将项目上的PDF上传,把自己需要的字段添加上,写写提示词,就可以批量识别提取并输出成 Excel 文件了。

这对于很多合同信息检查、或者其它纸质资料检查的项目来说,可以提高不少效率。







请到「今天看啥」查看全文


推荐文章
ImportNew  ·  web.xml 组件加载顺序
8 年前
青音约  ·  女追男,要不要?
8 年前
科学家庭育儿  ·  谈钱伤感情?呵呵,谈感情还伤心呢
8 年前
看懂龙头股  ·  【打赌直播】赚钱需要运气
8 年前