这个架构里面，用的是多轮的检索，即检索-问推理模型检索结果够不够-20250216220555_黄建同学的专栏文章_微信文章

这个架构里面，用的是多轮的检索，即检索-问推理模型检索结果够不够-20250216220555

黄建同学 · 微博 · AI · 2025-02-16 22:05

正文

2025-02-16 22:05
本条微博链接

这个架构里面，用的是多轮的检索，即检索->问推理模型检索结果够不够->不够则继续检索缺失部分->问推理模型->检索->问推理模型……。所以这套架构设计的初衷是为了准确，速度不应该是追求的目标。当然，实际用到线上系统肯定需要再限制检索的轮次。推理模型在这里强在推理模型适合处理这种"检索出来的信息够不够用"的需求。// @灿烂星空下的一只小猪 :deepseek做嵌套检索，速度会不会成问题，毕竟有个think过程

DeepSeek + RAG能带来什么新思路？

来自Deniz Askin博士的文章：RAG系统中，探索如何通过DeepSeek-r1实现逻辑推理与递归检索。

1. 提出了一个简单而高效的工作流程，通过DeepSeek-r1实现代理式的信息检索。系统能够准确回答复杂查询，比如“加拿大皇家银行的总部是否位于Sam Altman的兄弟公司总部之北？”

2. 工作流程利用Tavily检索网络信息，通过DeepSeek-r1的“推理层”进行信息的递归检索和推理，直到收集所有必要信息，过滤掉不相关的数据，并保留相关信息。

这里是重点：借助R1的推理来判断RAG检索到的信息是否充分，不充分则重新检索丢失的信息！

3. 将推理模型和代理循环结合到检索增强生成(RAG)工作流中，将会成为未来替代传统RAG方法的众多架构之一。这种结合显著提升了处理长、嵌套和复杂查询的性能。

这个架构里面，用的是多轮的检索，即检索-问推理模型检索结果够不够-20250216220555

正文

请到「今天看啥」查看全文