RAG与知识检索

16人浏览 / 0人评论 / 添加收藏
RAG(检索增强生成)= 知识检索 + 大模型生成;知识检索是 RAG 的核心引擎,负责从外部知识库精准召回信息,解决大模型幻觉、知识过时、领域盲区三大痛点。下面从概念、原理、架构、检索技术、应用与选型讲透。

一、核心概念

 
  • 知识检索(Knowledge Retrieval):从海量文档 / 数据库中,按语义或关键词快速找到与用户问题最相关的信息片段(如段落、句子),是传统搜索的升级(从关键词匹配到语义理解)。
  • RAG(Retrieval-Augmented Generation,检索增强生成):把知识检索与 ** 大语言模型(LLM)** 结合,先检索外部知识,再把检索结果 “喂” 给 LLM 生成答案,相当于给 LLM 开卷考试。
  • 关系知识检索是 RAG 的必要组件;没有检索,RAG 就退化成普通 LLM;检索质量直接决定 RAG 答案的准确性。
 

二、RAG 核心流程(5 步闭环)

 
  1. 文档入库(预处理)
    • 对 PDF/Word/ 网页等文档做清洗、分段(Chunking)、去重
    • 用 Embedding 模型(如 BGE、text-embedding)把文本转成向量,存入向量数据库(如 FAISS、Milvus、Pinecone)
  2. 用户提问 → 向量转换
    • 用户问题同样转成向量,进入检索阶段
  3. 知识检索(核心)
    • 向量数据库做相似度搜索(ANN),召回 Top-K 最相关文本片段(如 3–5 条)
    • 可选:重排(Rerank)(如 Cross-Encoder)提升相关性
  4. 增强 Prompt
    • 把 “用户问题 + 检索结果” 拼接成 Prompt,输入 LLM
  5. 生成答案
    • LLM 基于检索到的真实数据生成回答,附带引用来源,降低幻觉

用户提问 → 向量化 → 向量库检索 → 重排 → 增强Prompt → LLM生成 → 答案(带引用)

三、知识检索的关键技术(RAG 的 “心脏”)

 

1. 检索范式(3 类)

 
  • 关键词检索(传统):基于 TF-IDF、BM25,匹配字面关键词,快但不理解语义(如 “机加工”≠“机械加工”)
  • 语义检索(主流):基于向量 Embedding,理解语义相似性(如 “机加工”≈“金属切削”),RAG 默认首选
  • 混合检索(最优):关键词 + 语义融合,兼顾精准与泛化,工业级 RAG 标配
 

2. 向量数据库(存储 + 检索)

 
  • 作用:高效存储海量向量 + 快速相似度搜索(亿级向量毫秒级返回)
  • 主流:FAISS(开源)、Milvus(开源)、Pinecone(云服务)、Chroma(轻量)
 

3. 文档分块(Chunking)

 
  • 原则:语义完整 + 长度适中(200–1000 字),避免拆分一句话
  • 方法:固定长度、语义分割(如按标题 / 段落)、智能分块(LLM 辅助)
 

四、RAG vs 传统检索 vs 微调(对比)

技术 核心特点 优点 缺点

传统检索(搜索引擎)

只返回文档片段,不生成答案 快、准、可追溯 无生成能力,需人工总结

普通 LLM(无 RAG)

纯模型生成,依赖训练数据 自然流畅 幻觉高、知识过时、无领域知识

RAG(检索 + 生成)

先检索后生成,外部知识增强 幻觉低、知识新、可解释、低成本 依赖检索质量,多一步检索耗时

微调(Fine-tuning)

用领域数据重训模型 深度适配领域 成本高、周期长、难更新、易遗忘
 
结论:企业知识库 / 专业问答首选RAG;微调适合高频、深度领域场景;传统检索适合纯文档查找。
 

五、RAG 的主流架构(从简单到复杂)

 

1. 基础 RAG(单轮检索 + 生成)

 
  • 流程:一次检索→一次生成,适合简单问答
  • 缺点:复杂问题(多文档、多步骤)易遗漏信息
 

2. 进阶 RAG(多轮检索 + 反思)

 
  • 流程:生成→检查→补充检索→再生成,适合复杂推理
  • 代表:Self-RAG、ReAct,LLM 自主判断是否需要补充检索
 

3. 知识图谱 RAG(GraphRAG)

 
  • 核心:用知识图谱替代纯文本检索,抽取实体(如 “机加工”“车床”)与关系(如 “包含”“使用”),做多跳推理
  • 优势:回答更结构化、可解释,适合复杂关联问题(如 “机加工的工艺与设备关系”)

六、典型应用场景

 
  1. 企业知识库问答:内部文档、手册、FAQ,员工快速查询(如 “报销流程”)
  2. 行业专业问答:医疗、法律、金融、制造(如 “机加工公差标准”)
  3. 智能客服:产品手册、售后政策,自动解答用户问题
  4. 个人知识库:笔记、论文、资料,AI 辅助总结与问答
 

七、选型建议(新手→工业级)

 
  • 新手 / 轻量:用LangChain+Chroma + 开源 Embedding(如 BGE),快速搭建 Demo
  • 企业 / 生产:用Milvus/Pinecone + 混合检索 + Rerank+GraphRAG,保障高可用与准确性
  • LLM 选择:中文优先Qwen、GLM、Baichuan;英文用GPT-3.5/4、Claude
 

八、常见挑战与优化

 
  • 检索不准:优化分块、用混合检索、加 Rerank
  • 幻觉残留:强制引用检索片段、降低模型创造性、增加事实校验
  • 速度慢:向量库索引优化、缓存高频查询、异步检索
  • 知识更新:增量更新向量库、定时刷新、版本管理
 

总结

 
知识检索是 RAG 的根基,RAG 是知识检索的价值放大。通过 “检索 + 生成”,RAG 让 LLM 从 “闭卷记忆” 升级为 “开卷查阅”,在保证回答自然流畅的同时,大幅提升准确性、时效性与可解释性,成为当前企业 AI 落地的主流方案。
 

全部评论