这个架构里面,用的是多轮的检索,即检索->问推理模型检索结果够不够->不够则继续检索缺失部分->问推理模型->检索->问推理模型……。所以这套架构设计的初衷是为了准确,速度不应该是追求的目标。当然,实际用到线上系统肯定需要再限制检索的轮次。推理模型在这里强在推理模型适合处理这种"检索出来的信息够不够用"的需求。//
@灿烂星空下的一只小猪
:deepseek做嵌套检索,速度会不会成问题,毕竟有个think过程
DeepSeek + RAG能带来什么新思路?
来自Deniz Askin博士的文章:RAG系统中,探索如何通过DeepSeek-r1实现逻辑推理与递归检索。
1. 提出了一个简单而高效的工作流程,通过DeepSeek-r1实现代理式的信息检索。系统能够准确回答复杂查询,比如“加拿大皇家银行的总部是否位于Sam Altman的兄弟公司总部之北?”
2. 工作流程利用Tavily检索网络信息,通过DeepSeek-r1的“推理层”进行信息的递归检索和推理,直到收集所有必要信息,过滤掉不相关的数据,并保留相关信息。
这里是重点:借助R1的推理来判断RAG检索到的信息是否充分,不充分则重新检索丢失的信息!
3. 将推理模型和代理循环结合到检索增强生成(RAG)工作流中,将会成为未来替代传统RAG方法的众多架构之一。这种结合显著提升了处理长、嵌套和复杂查询的性能。
来自Deniz Askin博士的文章:RAG系统中,探索如何通过DeepSeek-r1实现逻辑推理与递归检索。
1. 提出了一个简单而高效的工作流程,通过DeepSeek-r1实现代理式的信息检索。系统能够准确回答复杂查询,比如“加拿大皇家银行的总部是否位于Sam Altman的兄弟公司总部之北?”
2. 工作流程利用Tavily检索网络信息,通过DeepSeek-r1的“推理层”进行信息的递归检索和推理,直到收集所有必要信息,过滤掉不相关的数据,并保留相关信息。
这里是重点:借助R1的推理来判断RAG检索到的信息是否充分,不充分则重新检索丢失的信息!
3. 将推理模型和代理循环结合到检索增强生成(RAG)工作流中,将会成为未来替代传统RAG方法的众多架构之一。这种结合显著提升了处理长、嵌套和复杂查询的性能。