返回技术能力
AI & Machine Learning

RAG

检索增强生成——让 LLM 能读你的私有数据再回答问题,AI 知识库的核心模式。


它是什么

RAG(Retrieval-Augmented Generation)先从知识库中检索相关文档,再把文档片段注入 prompt 让 LLM 基于这些信息回答。相当于给 LLM 配了一个「资料库」。

为什么重要

LLM 有知识截止日期,也不知道你的私有数据。RAG 解决了这两个问题——让 AI 能回答最新信息和企业内部知识,是 AI 落地的核心模式。

核心概念

EmbeddingChunkingVector StoreSemantic SearchRerankingHybrid Search

我的使用体验

做过 RAG 项目,踩过不少坑:chunk size 选不对效果天差地别,中文分块比英文麻烦很多。现在偏好小 chunk + 父文档召回的模式。

学习资源