专栏名称: 顶层架构领域
专注核心架构领域知识、经典干货总结、技术领域趋势跟踪,以通俗易懂的方式传播——复杂的事简单化
目录
相关文章推荐
新加坡眼  ·  【下周活动】 ... ·  2 天前  
新北方  ·  “春分”为啥刮大风,真能刮到四月中? ·  2 天前  
新北方  ·  17℃、18℃、20℃!羽绒服要穿不住了 ·  2 天前  
新北方  ·  沈阳这家著名医院宣布,退卡! ·  3 天前  
51好读  ›  专栏  ›  顶层架构领域

再次提升RAG性能:两种高效的Rerank模型实践指南

顶层架构领域  · 公众号  ·  · 2024-06-18 00:10

正文

点击上方 蓝色 顶层架构领域 ”,关注精彩与你分享
在高级RAG应用中,检索后处理环节至关重要 。Rerank技术通过重新排序检索出的文档块,确保与用户问题更相关的信息排在前面,从而 提高语言模型生成答案的质量 。在这个环节中,可以做一些诸如相似度过滤、关键词过滤、chunk内容替换等处理。其中, Rerank(重排序) 是一种常见的,也是在RAG应用优化中很常见的一种技术处理环节。
本文介绍了两种被广泛认可的Rerank模型: Cohere Rerank模型和bge-reranker-large模型 ,并提供了使用指南。

一、 为什么还需要Rerank

  • RAG应用中有多种索引类型,很多索引技术并非基于语义与向量构建,其检索的结果希望借助独立的Rerank实现语义重排
  • 在一些复杂RAG范式中,很多时候会使用多路混合检索来获取更多相关知识;这些来自不同源、不同检索算法的chunks要借助Rerank做重排
  • 即使是完全基于向量构建的索引,由于不同的嵌入模型、相似算法、语言环境、领域知识特点等影响,其语义检索的相关度排序也可能发生较大的偏差;此时借助独立的Rerank模型做纠正也非常有意义

二、在线模型 - Cohere Rerank模型

Cohere Rerank是一个商业闭源的Rerank模型。它根据 与指定查询问题的语义相关性对多个文本输入进行排序,专门用于帮助关键词或向量搜索返回的结果做重新排序与提升质量
为了使用Cohere Rerank,你首先需要在官方网站(https://cohere.com/)注册后申请测试的API-key(测试使用免费):
Cohere Rerank的使用非常简单,通常在LangChain与LlamaIndex框架中集成使用。下面展示如何在LangChain框架中使用Cohere Rerank来优化检索结果。
输出结果示例






请到「今天看啥」查看全文