
人工智能代理简介及应用场景
欢迎参加“人工智能代理入门”课程!本课程将为您提供构建人工智能代理的基础知识和实用示例。
加入Azure AI Discord社区,与其他学习者和AI代理开发者交流,解答您在课程中的疑问。
课程开始,我们将深入了解什么是人工智能代理,以及如何在应用程序和工作流程中有效使用它们。
课程内容
本课涵盖:
- 什么是人工智能代理及其不同类型?
- 人工智能代理适用的场景及其带来的帮助。
- 设计代理解决方案的基本构建模块。
学习目标
完成本课后,您将能够:
- 理解人工智能代理的概念及其与其他AI解决方案的区别。
- 高效应用人工智能代理。
- 为用户和客户设计高效的代理解决方案。
人工智能代理的定义及类型
什么是人工智能代理?
人工智能代理是一个系统,它通过赋予大型语言模型(LLMs)访问工具和知识的能力,扩展其功能,使其能够执行各种操作。
具体来说:
- 系统:代理不仅是单一组件,而是由多个部分组成的系统。基本组成包括:
- 环境:代理所运行的特定空间。例如,旅行预订代理的环境是旅行预订系统。
- 传感器:用于收集和解读环境信息。例如,旅行预订系统提供酒店空房和航班价格信息。
- 执行器:根据环境状态决定执行的操作,如为用户预订可用房间。

- 大型语言模型(LLMs):代理的概念早于LLMs,但利用LLMs的优势在于其理解人类语言和数据的能力,能够解读环境信息并制定改变环境的计划。
- 执行操作:传统LLMs仅限于根据用户提示生成内容,而在代理系统中,LLMs可以通过解读请求并使用环境中的工具来完成任务。
- 访问工具:LLMs可使用的工具由其运行环境和开发者决定。例如,旅行代理的工具受限于预订系统的功能,开发者也可限制其访问范围。
- 记忆与知识:代理可拥有短期对话记忆和长期知识库,后者可能来自其他系统、服务或代理。例如,旅行代理可访问用户的旅行偏好数据库。
人工智能代理的类型
以下是几种常见代理类型及其在旅行预订场景中的应用:
| 代理类型 | 描述 | 示例 |
|---|---|---|
| 简单反射代理 | 基于预定义规则立即执行操作 | 旅行代理根据邮件内容将投诉转发给客服 |
| 基于模型的反射代理 | 根据世界模型及其变化执行操作 | 旅行代理根据历史价格数据优先推荐价格变动显著的路线 |
| 目标导向代理 | 通过制定计划实现特定目标 | 旅行代理根据目标规划从当前位置到目的地的交通和住宿安排 |
| 效用导向代理 | 权衡偏好和权衡数值以实现目标 | 旅行代理在预订时权衡便利性与成本以最大化效用 |
| 学习型代理 | 通过反馈不断改进行为 | 旅行代理根据客户反馈调整未来预订策略 |
| 分层代理 | 多层级代理系统,高层代理分解任务给低层代理执行 | 旅行代理将取消行程任务拆分为多个子任务,由低层代理分别完成并反馈给高层代理 |
| 多代理系统(MAS) | 多个代理独立完成任务,可合作或竞争 | 合作:多个代理分别预订酒店、航班和娱乐;竞争:多个代理争夺同一酒店的预订资源 |
何时使用人工智能代理
以旅行代理为例,人工智能代理适合以下场景:

- 开放性问题:任务步骤难以硬编码,需由LLM自主确定完成流程。
- 多步骤流程:任务复杂,需要多轮使用工具或信息,而非一次性检索。
- 持续改进:代理通过环境或用户反馈不断优化表现。
更多关于使用人工智能代理的注意事项将在“构建可信赖的AI代理”课程中讲解。
代理解决方案基础
代理开发
设计代理系统的第一步是定义工具、操作和行为。本课程重点使用Azure AI代理服务,其特点包括:
- 支持OpenAI、Mistral、Llama等开放模型
- 通过Tripadvisor等提供商使用授权数据
- 支持标准化OpenAPI 3.0工具
代理模式
与LLM的交互通过提示完成。鉴于代理的半自主特性,环境变化后不必每次都手动重新提示LLM。我们采用代理模式,实现多步骤、可扩展的提示管理。
本课程将介绍当前流行的几种代理模式。
代理框架
代理框架帮助开发者通过代码实现代理模式,提供模板、插件和工具,提升代理系统的协作能力、可观测性和故障排查能力。
本课程将探索微软代理框架(MAF),用于构建生产级AI代理。


