Agentic RAG

Agentic RAG

本课程全面介绍了Agentic Retrieval-Augmented Generation(Agentic RAG),这是一种新兴的人工智能范式,允许大型语言模型(LLM)在从外部信息源检索数据的同时,自主规划下一步行动。与传统的静态检索后阅读模式不同,Agentic RAG采用迭代调用LLM的方式,结合工具或函数调用及结构化输出,系统会评估结果、优化查询、调用更多工具,直到获得满意的答案。

课程简介

本课程内容包括:

  • 理解Agentic RAG:了解大型语言模型如何自主规划步骤并从外部数据源获取信息。
  • 掌握迭代的制作者-审核者模式:理解通过反复调用LLM并结合工具调用和结构化输出来提升准确性和处理异常查询的循环过程。
  • 探索实际应用场景:识别Agentic RAG在注重正确性、复杂数据库交互和长流程任务中的优势。

学习目标

完成本课程后,您将能够:

  • 理解Agentic RAG的基本概念及其自主规划能力。
  • 掌握迭代调用LLM与工具集成的工作机制。
  • 理解系统如何自主掌控推理过程,灵活决策解决方案路径。
  • 了解Agentic模型如何独立检索市场趋势、竞争者数据、内部销售指标,综合分析并评估策略。
  • 熟悉循环交互、工具整合及状态记忆的实现方式。
  • 探索系统的自我纠错机制及失败处理策略。
  • 明确Agentic RAG的能力边界及其依赖的基础设施。
  • 识别适合Agentic RAG的实际应用场景及其价值。
  • 理解治理、透明度与信任的重要性。

什么是Agentic RAG?

Agentic RAG是一种新兴的AI范式,允许大型语言模型在检索外部信息的同时,自主规划下一步操作。它通过迭代调用LLM,结合工具调用和结构化输出,持续评估和优化查询,直到获得高质量答案。该“制作者-审核者”循环模式提升了结果的准确性,能有效处理异常查询。

系统自主掌控推理过程,能够重写失败的查询,选择不同的检索方法,并整合多种工具(如Azure AI Search的向量搜索、SQL数据库或自定义API),无需复杂的编排框架,仅通过简单的“LLM调用→工具使用→LLM调用”循环即可产生复杂且可靠的输出。

Agentic RAG核心循环

掌控推理过程

Agentic系统的核心特征是自主掌控推理过程。传统RAG通常依赖预定义的检索路径或思路链,而Agentic系统则根据所获得信息的质量,自主决定解决问题的步骤顺序。

例如,在制定产品发布策略时,Agentic模型不会仅依赖预设的提示,而是会自主决定:

  1. 利用Bing网络检索当前市场趋势报告。
  2. 通过Azure AI Search获取竞争对手相关数据。
  3. 使用Azure SQL数据库关联历史销售数据。
  4. 通过Azure OpenAI服务综合分析并制定策略。
  5. 评估策略的完整性,必要时再次检索补充信息。

所有这些步骤均由模型自主决定,而非人工预设。

迭代循环、工具集成与记忆

工具集成架构

Agentic系统依赖循环交互模式:

  • 初始调用:用户输入目标或提示给LLM。
  • 工具调用:模型识别信息缺失或指令模糊时,选择合适工具(如向量数据库查询或结构化SQL调用)获取更多上下文。
  • 评估与优化:模型审查返回数据,判断是否满足需求,若不满足则优化查询或更换工具。
  • 循环执行:持续迭代,直到模型确认信息充足,给出最终回答。
  • 状态与记忆:系统跨步骤保持状态和记忆,避免重复循环,做出更明智的决策。

这种机制使模型能够逐步深化理解,处理复杂多步骤任务,无需人工频繁干预。

失败处理与自我纠错

Agentic RAG具备强大的自我纠错能力。当遇到无关文档或查询失败时,系统会:

  • 迭代重试:尝试新的检索策略,重写数据库查询,或访问不同数据集。
  • 诊断工具:调用辅助功能帮助调试推理过程,确认数据准确性。Azure AI Tracing等工具支持强健的监控与可观测性。
  • 人工干预:在关键或反复失败场景下,模型会标记不确定性,请求人工指导,吸收反馈后改进表现。

自我纠错机制

能力边界

尽管Agentic RAG具备一定自主性,但它并非通用人工智能。其“代理”能力受限于开发者提供的工具、数据源和策略,无法自行创造工具或超出设定领域。其优势在于动态协调现有资源。

主要区别包括:

  1. 领域专属自主性:聚焦于已知领域内实现用户目标,通过查询重写和工具选择提升效果。
  2. 基础设施依赖:能力依赖集成的工具和数据,无法超越人类设定的边界。
  3. 遵守安全规范:始终受伦理、合规和业务政策约束,确保安全和监督。

实际应用场景与价值

Agentic RAG在需要反复优化和高准确度的场景中表现突出:

  1. 注重正确性的环境:如合规检查、法规分析和法律研究,模型可多次核实事实,参考多源数据,反复优化查询,确保答案严谨。
  2. 复杂数据库交互:处理结构化数据时,模型能自主调整查询,确保检索结果符合用户意图。
  3. 长流程任务:在持续更新信息的长时间任务中,Agentic RAG可不断整合新数据,调整策略,适应问题变化。

治理、透明度与信任

随着系统推理自主性增强,治理和透明度尤为重要:

  • 可解释推理:模型能提供查询轨迹、参考来源及推理步骤,借助Azure AI内容安全和追踪工具保障透明度。
  • 偏见控制与均衡检索:开发者可调整检索策略,确保数据来源均衡,定期审计输出,利用Azure机器学习等工具检测偏差。
  • 人工监督与合规:敏感任务仍需人工审核,Agentic RAG作为辅助,提供更严谨的选项而非替代人类判断。

以下为Literal AI(Chainlit背后公司)提供的Agent运行示例:

Agent运行示例

结语

Agentic RAG代表了AI处理复杂数据密集型任务的自然进化。通过循环交互、自主选择工具和不断优化查询,系统超越了静态提示执行,成为更具适应性和上下文感知的决策者。尽管仍受限于人类定义的基础设施和伦理规范,这些代理能力为企业和终端用户带来了更丰富、动态且实用的AI交互体验。

相关资源

学术论文

相关课程