第8回：什么是RAG——将普通AI变成企业专属专家的技术

RAG示意图

RAG是“检索增强生成”（Retrieval-Augmented Generation）的缩写。

你是否曾向ChatGPT或Gemini询问过贵公司的工作规章或最新产品规格，却得到不相关的回答？AI在面对未学习过或最新的信息时，可能会凭空生成看似合理但实际上错误的答案，这就是我们在第二回中提到的“幻觉”现象。

虽然AI非常便利，但直接应用于企业内部工作时存在困难。为了解决这一弱点，本文介绍的技术之一就是“RAG”。

先检索外部知识再生成回答的机制

RAG的核心在于，AI在生成回答之前，会先检索外部知识库或企业内部文档，并以此作为参考来生成答案。

例如，将公司规章、产品手册、常见问题解答、会议记录、规格说明书等资料预先整理成便于AI检索的数据库。当用户询问“新产品A的保修期是多久？”时，AI不会直接生成答案，而是先搜索相关文档。

随后，将检索到的资料作为参考信息传递给大型语言模型（LLM）。LLM不仅依赖自身已有的知识，还会结合这些资料内容来生成回答。

换句话说，RAG并非让AI“全部记忆”，而是在需要时检索必要资料，并以此为依据作答。

打个比方，普通的LLM就像“闭卷考试”，无论多聪明，都无法回答教科书之外的最新信息或公司机密数据，强行回答时可能会编造虚假信息。

而RAG则像“开卷考试”，AI可以查阅手头的内部手册和文档，边看边答，从而减少幻觉现象，更准确地基于最新和专属信息作答。

Retrieval（检索）、Augmented（增强）、Generation（生成）——这就是RAG的基本理念。

在第四回中，我们提到过通过“微调”来调整AI的知识和回答风格。有人可能会认为，既然是为了添加知识，为什么不直接用微调而非RAG呢？

实际上，两者适用场景不同。微调适合调整模型的行为和专业性，但每次信息更新都需重新训练，成本和工作量较大。对于频繁变动的规章或产品规格，微调并不高效。

相比之下，RAG只需替换参考文档，便能轻松跟进最新信息。它不是重建AI模型，而是更新外部资料。

在企业内部AI或客服AI中，这种方式优势明显。与其让AI“记住所有公司信息”，不如让它“准确检索并阅读必要资料”，更符合实际运营需求。

不过，使用RAG并不保证答案一定正确。如果检索的文档过时或有误，回答自然也会出错。此外，AI有时也可能误解资料内容。

尽管如此，RAG的优势在于可以明确引用依据文档，方便人工核查。

未来企业AI的应用，不仅要关注模型本身的智能水平，更要重视“选择哪些资料、如何检索、如何利用资料生成回答”的策略。

RAG可视为将普通知识的AI转变为能处理企业专属信息的“专属助手”的基础技术。