专栏名称: GitHubStore
分享有意思的开源项目
目录
相关文章推荐
李楠或kkk  ·  过去一周,x ... ·  18 小时前  
调研纪要  ·  Figure:Hello,Helix! ·  2 天前  
调研纪要  ·  Figure:Hello,Helix! ·  2 天前  
昆明警方发布  ·  “顶流”眼中的昆明公安 ·  2 天前  
中国能源报  ·  国产首次,成功试产! ·  3 天前  
51好读  ›  专栏  ›  GitHubStore

Knowledge Table:简化从非结构化文档中提取和探索结构化数据

GitHubStore  · 公众号  · 科技创业 科技自媒体  · 2024-10-21 09:13

主要观点总结

文章介绍了知识表这一开源项目,其旨在简化从非结构化文档中提取和探索结构化数据的过程。该项目提供自然语言查询界面,可创建结构化知识表示,如表格和图形,并适应各种用例。其灵活的定制性使得项目完全可以根据用户需求进行定制。

关键观点总结

关键观点1: 知识表项目简介及其目标

知识表是一个开源项目,旨在简化从非结构化文档中提取和探索结构化数据的过程。它提供自然语言查询界面,并适应各种用例。目标是为业务用户提供熟悉的电子表格界面,同时为开发人员提供灵活且高度可配置的后端。

关键观点2: 知识表的功能和特点

知识表具备可定制的提取规则、微调的格式选项以及通过UI中显示的来源进行的数据可追溯性。其直观的界面使技术和非技术用户都可以轻松探索和管理数据。

关键观点3: 知识表的运行和访问方式

用户可以从Docker运行知识表项目,也可以通过本地运行的方式操作。具体步骤包括先决条件的准备、后端克隆存储库、激活虚拟环境、安装依赖项以及启动后端等。项目链接提供了GitHub上的项目地址,扫码可加入技术交流群。


正文

项目简介

知识表 是一个开源包,旨在简化从非结构化文档中提取和探索结构化数据的过程。它允许使用自然语言查询界面创建结构化知识表示,例如表格和图形。凭借可定制的提取规则、微调的格式选项以及通过 UI 中显示的来源进行的数据可追溯性,知识表可适应各种用例。


我们的目标是为业务用户提供熟悉的、类似电子表格的界面,同时为开发人员提供灵活且高度可配置的后端。无论您是处理少量文件还是浏览数百个文档,这都可确保无缝集成到现有 RAG 工作流程。


为什么是知识表?

更好的 RAG 系统依赖于为非结构化数据引入结构,将其转换为表格或图形等格式。WhyHow.AI 开发了组织文档内容和元数据的工具,而知识表等工具在此过程中发挥着关键作用。其直观的界面使技术和非技术用户都可以轻松探索和管理数据。

作为一个开源项目,知识表可以完全定制以满足您的需求。无论您是集成自己的模型、工作流程还是提取规则,其灵活性都支持创新并适应您的特定要求。通过以正确的格式构建正确的数据,知识表有助于简化数据提取过程,从而更轻松地从非结构化信息中释放有价值的见解。



入门

从 Docker 运行

先决条件

  • Docker

  • Docker Compose

Starting the app 启动应用程序

docker-compose up -d --build

停止应用程序

docker-compose down

访问项目

前端可以通过 http://localhost:3000 访问,后端可以通过 http://localhost:8000 访问。


本地运行

先决条件

  • Python 3.10+

  • Bun(用于前端)


后端

  1. 克隆存储库:

  2. 导航到后端目录:

    cd knowledge-table/backend/
  3. 创建并激活虚拟环境:

    python3 -m venv venvsource venv/bin/activate  # On Windows use `venv\Scripts�ctivate`
  4. 安装依赖项:

    对于基本安装:

    pip install .

    使用开发工具安装:

pip






请到「今天看啥」查看全文