专栏名称: 深度学习与图网络
关注图网络、图表示学习,最近顶会顶刊动态以及机器学习基本方法,包括无监督学习、半监督学习、弱监督学习、元学习等
目录
相关文章推荐
中国航务周刊  ·  【年报】国际原油海运市场2025年展望 ·  2 天前  
中国舞台美术学会  ·  文化产业2024十大特征+2025十大趋势预测 ·  2 天前  
中国航务周刊  ·  宁德时代与国际物流巨头签约 ·  3 天前  
中国航务周刊  ·  【展商推介】上华国际,邀您莅临“2025国际 ... ·  4 天前  
51好读  ›  专栏  ›  深度学习与图网络

RAG黑盒被打开了,可视化RAGViz闪亮全场

深度学习与图网络  · 公众号  ·  · 2024-11-19 09:33

正文

本文来源 | PaperAgent
CMU( 卡内基梅隆大学 )开源 RAGViz :它 提供了对 检索文档 模型注意力 可视化 ,帮助用户理解生成的标记与检索文档之间的交互,可用于 诊断和可视化RAG系统

Query=“ 为什么猪会飞? ”的可视化。突出显示的生成内容没有基于任何上下文文档,展示了 内部幻觉

RAGViz特性和用例

  1. 注意力可视化 :RAGViz通过标记高亮显示来可视化生成的标记序列对输入标记的关注度,并通过颜色强度来衡量关注度。

  2. 文档级别的关注度 :展示生成输出对每个检索段落的关注度,以累积文档级别的注意力分数形式展现。

  3. 拖动选择用户界面 :用户可以通过拖动选择来轻松检查任何标记序列的累积关注度。

  4. 文档切换功能 :用户可以选择在构建答案上下文时省略特定的标记和文档,以比较添加或移除标记和文档对LLM输出的影响。

  5. 自定义上下文文档数量 :用户可以指定从数据集中检索的相关文档片段的数量。

  6. API密钥认证 :RAGViz实现了HTTP请求上的中间件功能,以确保请求经过适当的认证。

在使用文档切换功能时,对选定的标记序列进行 注意力可视化

演示了RAGViz识别和调试 外部幻觉 的能力

RAGViz 系统架构

RAGViz的系统架构包含四个主要组件: 近似最近邻(ANN)索引、后端服务器、LLM推理服务器和前端用户界面 。这些组件被设计为可以独立配置,以提高灵活性。

  1. ANN索引(Dense Retrieval)

  • 在密集检索中,查询和文档被编码成高维特征向量,然后通过相似性搜索(如余弦相似度或内积)来确定查询向量的最近邻居。

  • RAGViz使用分布式系统来存储和索引这些向量,每个节点存储一部分向量并提供REST API来返回查询的近似最近邻。

  • 上下文构建器(Context Builder)

    • 后端服务器处理构建语言模型上下文的所有逻辑,包括加载嵌入模型、管理后端逻辑和存储完整语料库。

    • 接收到的查询经过认证后被编码成嵌入向量,并路由到所有工作节点进行ANN搜索。

    • 从每个工作节点检索到的顶部文档会被重新排序,以返回整个数据集中查询的最终最近邻。

    • RAGViz提供两种文档片段提取方法:naive first(简单首段)和sliding window( 滑动窗口 )。

  • 生成和注意力输出(Generation and Attention Output)







  • 请到「今天看啥」查看全文