AI & Machine Learning

RAG

检索增强生成——让 LLM 能读你的私有数据再回答问题，AI 知识库的核心模式。

它是什么

RAG（Retrieval-Augmented Generation）先从知识库中检索相关文档，再把文档片段注入 prompt 让 LLM 基于这些信息回答。相当于给 LLM 配了一个「资料库」。

LLM 有知识截止日期，也不知道你的私有数据。RAG 解决了这两个问题——让 AI 能回答最新信息和企业内部知识，是 AI 落地的核心模式。

EmbeddingChunkingVector StoreSemantic SearchRerankingHybrid Search

做过 RAG 项目，踩过不少坑：chunk size 选不对效果天差地别，中文分块比英文麻烦很多。现在偏好小 chunk + 父文档召回的模式。