专栏名称: 天翼智库
天翼智库是中国电信研究院战略发展研究所承办的面向公众的智库研究信息发布平台,为您提供最新信息通信行业发展动态、政策观察、产业分析和战略洞察等。
目录
相关文章推荐
中国国家地理  ·  中国最“八卦”的城市,原来是它! ·  15 小时前  
中国国家地理  ·  十六的月亮真比十五圆? ·  15 小时前  
中国国家地理  ·  跟着DeepSeek学地理,靠谱不? ·  昨天  
中国国家地理  ·  科考旅行 | 邺城北朝造像艺术考察报名 ·  昨天  
中国国家地理  ·  气象万千,美不胜收 ·  2 天前  
51好读  ›  专栏  ›  天翼智库

每周一产品:检索增强生成RAG(Retrieval-Augmented Generation)

天翼智库  · 公众号  ·  · 2025-01-26 07:00

正文

RAG拓展LLM边界,是构建私有、去中心化AI应用的关键技术

Retrieval-Augmented Generation(简称RAG)是一种结合了信息检索与语言生成的人工智能技术,通过从外部知识库中检索相关信息,并将其与生成模型相结合,形成更准确、更可靠的回答或内容,从而提升大型语言模型(LLM)在处理知识密集型任务时的表现。

RAG由Facebook AI Research(FAIR)团队于2020年提出,为了解决当时预训练语言模型知识不易更新扩展和幻觉问题,通过多个知识密集型NLP任务上进行评估,RAG在多项开放域问答任务中取得显著效果 1

RAG极大地拓展LLM应用边界,尤其适用于需要专业知识或不断更新知识的场景,成为大模型时代最成功的落地模式之一。 一是低成本的知识更新扩展。 对接私域数据和知识源,能够处理更专业和定制化的任务。 二是提升生成质量和减少幻觉。 能提供外部证据来源,帮助用户理解生成答案的依据,降低生成不真实信息的风险。

技术进展:Modular RAG模块化设计和编排,朝完成复杂工作方式演进

RAG主要经历了三种技术范式的演进。一是Naive RAG。包括索引、检索和生成三个步骤,将文档库分割通过编码器构建向量索引存储在向量数据库中,再针对问题检索相似度片段,补充检索上下文从而生成问题的回答。二是Advanced RAG。通过检索前和检索后优化,通过数据清洗和添加元数据等方法提升检索效率。三是Modular RAG。引入具体功能模块,如搜索模块直接对接搜索引擎、数据库和知识图谱;记忆模块创建无界限的内存池指导检索。使用者可以按需对模块进行设计和编排,满足不同任务查询需求的灵活性。

图1 三种RAG技术范式 2

RAG技术还在不断优化。 一是检索效率提高。 业界正研发更先进的检索算法和技术,如优化索引结构、相似度计算方法等,以加快检索速度、减少延迟、扩展上下文长度。 二是多模态协同融合。 从文本拓展到图像、音频、视频和代码等多模态数据,实现跨模态的检索与生成。 三是复杂工作流的智能化。 借助Agent使RAG系统能针对复杂的查询任务主动规划解决步骤,实现对任务的优化输出。

应用范畴:以问答为核心任务,RAG在领域知识服务、搜索优化等领域应用广泛

RAG的核心优势在于能将外部知识与生成模型相结合,提升生成内容的精准度和可靠性,能结合专业知识来完成问答的任务。在实际应用中,RAG的最大价值体现在领域知识服务、搜索优化和智能客服等场景。

领域知识服务。 知识库是企业的智慧中枢,汇集企业经营经验、流程、机理等主题内容,通过RAG+LLM构建知识库,能够进一步释放员工生产力,如企业搜索和知识管理平台Glean能与100+ SaaS应用相连接,让企业用户跨应用搜索数据,并针对用户个性化生成答案和结果,2024年9月,Glean获得2.6亿美元E轮融资,估值达到46亿美元。金融、政务、电信是领域知识服务应用较为领先的领域,其中金融应用场景以智能客服、智能投顾为代表;政务领域应用场景以12345热线、政策标准知识库搜索等为代表;电信行业应用场景以专业知识共享、业务办理等为代表。

搜索优化。 RAG技术在搜索引擎优化中表现出色,能够整合检索信息生成流畅的文本,提高搜索结果的相关性和简洁性。2024年12月,Perplexity收购专注于RAG的初创公司Carbon,计划2025年实现对Notion、Google Docs、Slack等企业应用中的文件和工作消息进行搜索。

智能客服。 RAG+LLM能够快速理解用户意图,提供准确的回答。如智谱AI通过“Chat GLM大模型+RAG”方案,将公共事务客服问答系统的正确率从60%提升至90%以上。

典型产品:开箱即用的工具链技术栈初步形成,国产工具正成为基础技术堆栈

近两年,RAG技术框架出现井喷,朝着两大方向发展。 一是定制化、专业化。 业界知名的Langchain和Llamalndex具备模块化和灵活性的开发工具链,提供多种RAG相关的API接口,适合有高度定制化需求的生产项目实施。在Langchain思想基础上,智谱AI的开源Langchain-Chatchat提供对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。 二是简化、开箱即用。 虽然Dify、AnythingLLM等新兴开源工具功能模块还有待丰富,但开发者可以使用这些低代码或零代码工具开发应用,大大简化开发过程。与Langchain在Github上98.1k的star数比较,这些开源工具库受欢迎程度并不逊色。

表1 RAG知识库的流行开源工具库

RAG工具正成为基础技术堆栈,为企业应用奠定良好的基础,表1所列开源工具能帮助企业快速搭建大模型应用,具备诸多应用优势: 一是支持主流开源工具。 支持使用开源LLM、Embedding模型与向量数据库离线私有部署;同时支持云端API能力调用,故对资源要求并不高,但云端调用不适合高隐私和数据合规场景。 二是部署快速便捷。 如MaxKB,Dify提供易用界面和一键部署功能,使开发者可以快速将应用部署到云端或本地。 三是无缝嵌入业务系统。 工具库支持零编码快速嵌入到第三方业务系统,让已有系统快速拥有智能问答能力。

除AI创业公司外,传统的软件和云服务提供商也在构建以RAG为中心的产品和服务。如Amazon Kendra GenAI专为检索增强生成和智能搜索设计,可以与Bedrock知识库集成,帮助企业更高效地构建数字助理和智能搜索。知识管理解决方案服务商蓝凌提出aiKM全景解决方案,基于双能(赋能+智能)模型理念,融合AI大模型、知识图谱、RAG等技术,面向战略、业务、管理、员工四个维度提供知识智能支撑、场景智能支撑及决策智能支撑 3

注释

1. 《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》

2. 《Retrieval-Augmented Generation for Large Language Models: A Survey》

3. 《2024·爱分析大模型+知识库厂商全景报告》


本文作者

田盼

战略发展研究所

副主任分析师

高级工程师,就职于中国电信研究院,长期从事产业数字化政策、需求和趋势研究。

张秀凤

战略发展研究所

二级分析师

硕士、高级工程师。具有多年通信行业、零售行业研究经验。近年来主要从事数字政府、行业数字化转型等领域的研究。







请到「今天看啥」查看全文


推荐文章
中国国家地理  ·  中国最“八卦”的城市,原来是它!
15 小时前
中国国家地理  ·  十六的月亮真比十五圆?
15 小时前
中国国家地理  ·  跟着DeepSeek学地理,靠谱不?
昨天
中国国家地理  ·  科考旅行 | 邺城北朝造像艺术考察报名
昨天
中国国家地理  ·  气象万千,美不胜收
2 天前
冯站长之家  ·  2016年12月5日财经新闻(语音版)
8 年前
咱是闽南人  ·  泉州再上央视,香都,茶都名满天下!
7 年前