专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
目录
相关文章推荐
机器之心  ·  重磅发现!DeepSeek ... ·  12 小时前  
爱可可-爱生活  ·  【最大的AI生物模型Evo ... ·  19 小时前  
黄建同学  ·  来自Cameron R. Wolfe ... ·  昨天  
爱可可-爱生活  ·  【ChatGPT + ... ·  2 天前  
51好读  ›  专栏  ›  黄建同学

这个架构里面,用的是多轮的检索,即检索-问推理模型检索结果够不够-20250216220555

黄建同学  · 微博  · AI  · 2025-02-16 22:05

正文

2025-02-16 22:05

这个架构里面,用的是多轮的检索,即检索->问推理模型检索结果够不够->不够则继续检索缺失部分->问推理模型->检索->问推理模型……。所以这套架构设计的初衷是为了准确,速度不应该是追求的目标。当然,实际用到线上系统肯定需要再限制检索的轮次。推理模型在这里强在推理模型适合处理这种"检索出来的信息够不够用"的需求。// @灿烂星空下的一只小猪 :deepseek做嵌套检索,速度会不会成问题,毕竟有个think过程
DeepSeek + RAG能带来什么新思路?

来自Deniz Askin博士的文章:RAG系统中,探索如何通过DeepSeek-r1实现逻辑推理与递归检索。

1. 提出了一个简单而高效的工作流程,通过DeepSeek-r1实现代理式的信息检索。系统能够准确回答复杂查询,比如“加拿大皇家银行的总部是否位于Sam Altman的兄弟公司总部之北?”

2. 工作流程利用Tavily检索网络信息,通过DeepSeek-r1的“推理层”进行信息的递归检索和推理,直到收集所有必要信息,过滤掉不相关的数据,并保留相关信息。

这里是重点:借助R1的推理来判断RAG检索到的信息是否充分,不充分则重新检索丢失的信息!

3. 将推理模型和代理循环结合到检索增强生成(RAG)工作流中,将会成为未来替代传统RAG方法的众多架构之一。这种结合显著提升了处理长、嵌套和复杂查询的性能。






请到「今天看啥」查看全文