文章介绍了知识表这一开源项目,其旨在简化从非结构化文档中提取和探索结构化数据的过程。该项目提供自然语言查询界面,可创建结构化知识表示,如表格和图形,并适应各种用例。其灵活的定制性使得项目完全可以根据用户需求进行定制。
知识表是一个开源项目,旨在简化从非结构化文档中提取和探索结构化数据的过程。它提供自然语言查询界面,并适应各种用例。目标是为业务用户提供熟悉的电子表格界面,同时为开发人员提供灵活且高度可配置的后端。
知识表具备可定制的提取规则、微调的格式选项以及通过UI中显示的来源进行的数据可追溯性。其直观的界面使技术和非技术用户都可以轻松探索和管理数据。
用户可以从Docker运行知识表项目,也可以通过本地运行的方式操作。具体步骤包括先决条件的准备、后端克隆存储库、激活虚拟环境、安装依赖项以及启动后端等。项目链接提供了GitHub上的项目地址,扫码可加入技术交流群。
项目简介
知识表
是一个开源包,旨在简化从非结构化文档中提取和探索结构化数据的过程。它允许使用自然语言查询界面创建结构化知识表示,例如表格和图形。凭借可定制的提取规则、微调的格式选项以及通过 UI 中显示的来源进行的数据可追溯性,知识表可适应各种用例。
我们的目标是为业务用户提供熟悉的、类似电子表格的界面,同时为开发人员提供灵活且高度可配置的后端。无论您是处理少量文件还是浏览数百个文档,这都可确保无缝集成到现有 RAG 工作流程。
为什么是知识表?
更好的 RAG 系统依赖于为非结构化数据引入结构,将其转换为表格或图形等格式。WhyHow.AI 开发了组织文档内容和元数据的工具,而知识表等工具在此过程中发挥着关键作用。其直观的界面使技术和非技术用户都可以轻松探索和管理数据。
作为一个开源项目,知识表可以完全定制以满足您的需求。无论您是集成自己的模型、工作流程还是提取规则,其灵活性都支持创新并适应您的特定要求。通过以正确的格式构建正确的数据,知识表有助于简化数据提取过程,从而更轻松地从非结构化信息中释放有价值的见解。
入门
从 Docker 运行
先决条件
Starting the app
启动应用程序
停止应用程序
访问项目
前端可以通过
http://localhost:3000
访问,后端可以通过
http://localhost:8000
访问。
本地运行
先决条件
后端
-
克隆存储库:
-
导航到后端目录:
cd knowledge-table/backend/
-
创建并激活虚拟环境:
python3 -m venv venv
source venv/bin/activate
-
安装依赖项:
对于基本安装:
使用开发工具安装: