智能代理平台的演进：使用Claude托管代理构建生产级应用

将一个智能代理投入生产环境，远不止拥有一个好的提示词那么简单。代理需要有运行其生成代码的环境，访问数据的凭证，可观察的会话，以及能够随使用量扩展的基础设施。在Anthropic的应用AI团队，我们处于产品、研究和客户构建Claude应用的交汇点，反复观察到一个规律：基础设施是区分原型和生产代理的关键。许多团队常常在安全、状态管理、权限控制和代理框架调优上消耗大量开发周期。

Claude托管代理是一套可组合的API，专为构建和部署生产级代理设计。它将针对性能调优的代理框架与生产基础设施结合，使团队能够在几天内完成从原型到上线的转变，而非数月。本文将介绍Anthropic智能代理构建模块的演进历程、我们为何开发Claude托管代理，以及团队如何在生产环境中使用它。

智能代理架构的演进

2023年，我们向开发者开放Claude时，API设计非常简洁：输入token，输出token。你发送提示，Claude返回完成内容，剩下的代理框架和基础设施由你搭建。

随着时间推移，API功能逐渐丰富，但底层契约未变：一次请求对应模型一次响应，应用决定下一步操作。对于文档摘要、支持工单分类、文本重写等单轮任务，这种方式足够用。

然而，用户需求逐渐超出单轮任务。他们希望Claude能完成整个任务流程：查询信息、执行操作、观察变化并决定下一步，还希望它能直接在现有系统中运行，如代码库、内部维基或工单系统。

使用API时，将Claude变成代理意味着你必须自己构建循环：询问模型下一步、运行工具、反馈结果、重复执行。你需要负责代理框架的搭建和部署，且随着模型演进可能需要调优。对于需要高度定制的代理，这种方式合理；但对于更可预测、复杂度较低的任务，持续调优框架变得繁琐。

Claude消息API

2025年，我们推出了Claude Code，这是一个让Claude直接与代码库交互的智能编码工具，内置了自己的代理框架：循环、工具执行、子代理、上下文管理及丰富功能，使其成为高效代理。开发者自然希望在各自领域拥有类似的框架支持。

为此，我们发布了Claude Agent SDK，让开发者基于Claude Code的框架构建自己的代理，而无需维护自研循环。对许多团队来说，这标志着代理变得实用：框架已针对Claude调优，配备基础设施原语，并随着Claude Code持续改进。

即便有框架，生产环境部署代理仍面临挑战：

托管与扩展：代理运行在哪？多小时任务进程如何存活？使用量增长时如何扩展？
会话管理：代理的历史和进度存储在哪里？中断后能否无缝恢复？能否回溯查看历史会话？
文件系统管理：代理执行任务会产生文件、代码等产物，工作空间如何管理？运行间工作区如何处理？
执行隔离：Claude生成的代码在哪里执行？出错时影响范围多大？生产环境中信任的边界是什么？
凭证管理：代理如何安全访问系统？如何避免凭证泄露？
可观测性：代理自主运行时，能否重构其每一步操作？

Agent SDK通过Claude Code的机制解决了部分问题：代理拥有真实文件系统，会话状态可本地或外部存储持久化，且通过OpenTelemetry支持导出到现有监控系统。

Claude Agent SDK架构

但随着团队将代理从本地开发推向生产环境，需求转向可扩展且托管的基础设施。模型和框架日益复杂，运行时间更长、执行更多代码、涉及更多系统和操作，扩展、安全和沙箱隔离难度加大。

这些挑战部分源于架构设计：代理框架通常与其操作的文件系统运行在同一容器内。容器启动需时间，代理和代码执行与凭证共存，容器终止即任务终止。

托管代理通过将“大脑”与“执行手”分离解决了这些问题。调用Claude的框架独立于代码执行的沙箱，二者通过会话——一个追加日志，记录所有模型调用、工具调用及结果——连接。Claude可在容器启动前开始推理，沙箱远离凭证，且可随时重建整个运行过程。

Claude托管代理架构

何时及为何使用Claude托管代理

使用托管代理时，用户定义任务、工具和安全策略，Anthropic负责在基础设施上运行代理及其循环：如何为代理提供执行环境调用工具，如何失败恢复，多代理协调等。

当框架未随模型智能演进时，代理会失效。例如，Claude Sonnet 4.5版本中，代理在接近上下文限制时急于完成，导致工作被截断，称为“上下文焦虑”。我们通过添加上下文重置机制解决，但该假设在后续模型Claude Opus 4.5中不再适用，重置反而成了负担。

对大多数组织而言，维护框架是额外负担，且无法成为产品差异化。框架需针对特定模型行为调优；Claude的压缩、工具执行和缓存机制与其他模型不同。Claude托管代理让框架随模型演进，团队可专注于差异化要素：上下文管理和领域专业知识。

托管代理围绕三大资源构建：代理（agent）、环境（environment）和会话（session）。代理是配置：模型、提示、工具及安全策略。环境是代理运行的执行上下文：沙箱容器、网络规则及预装包，托管于Anthropic云或用户自有基础设施。每次运行即为会话，绑定代理与环境，拥有独立沙箱实例。会话在服务器端持久保存事件历史、沙箱状态和输出，支持长时间任务的暂停、恢复及逐步追踪。定义一次代理和环境后，可针对同一配置运行多个会话，满足负载增长需求。

代理、环境与会话示意

在托管代理上构建生产级和可扩展应用

在应用AI团队，我们见证代理从原型到生产的过程，涵盖Anthropic内部及客户系统，涉及编码、金融、支持、法律等多个领域。这让我们清晰了解演示与生产代理的差异及团队常遇瓶颈。

以下是选择Claude托管代理的主要理由：

凭证安全隔离。单容器运行时，Claude生成的代码与凭证共存，存在提示注入风险，可能导致凭证泄露。虽然可在容器内设置防护，但架构分离更安全。凭证存储于独立保险库，代理通过代理服务按需获取解密。托管代理内置凭证保险库，无需自建密钥库，避免频繁传输令牌，且可追踪代理代表的终端用户。凭证采用信封加密，访问需签名请求令牌验证。

托管代理运行时架构

降低延迟，消除沙箱启动开销。延迟对企业用户体验至关重要。无托管架构时，每次会话都需启动容器，哪怕代理仅需思考不调用工具，启动时间也浪费用户等待。托管代理允许Claude在环境启动同时开始推理，不调用工具的会话跳过容器启动。测试显示，中位数响应时间缩短约60%，最慢响应缩短超过90%。
可靠持久的会话支持管理、可观测性和记忆功能。托管代理采用事件流模型，会话为持续事件流：每次模型调用、工具调用及结果均追加至外部日志。该架构支持实时更新，支持随时恢复，无需管理数据库或保存点。会话历史持续保存，空闲时容器检查点，支持无缝续接。完整事件记录带来内建可观测性和记忆功能：Claude开发者控制台提供会话时间线视图和深度调试体验。托管代理还支持记忆和梦境功能，后者定期分析会话和记忆库，提炼模式，帮助代理持续改进。
灵活支持Anthropic托管或自托管云容器。默认情况下，托管代理可将编排和工具执行委托给Anthropic云容器，简化托管和扩展，快速上线。由于“大脑”与“执行手”分离，执行环境可部署在用户虚拟私有云（VPC）内。我们提供自托管沙箱，确保代理代码、文件系统和网络流量不离开用户环境。通过MCP隧道，Claude可连接运行在私有网络内的模型上下文协议服务器，实现对执行位置和访问路径的精细控制。

托管代理架构示意

此外，托管代理还支持代理自评分、多代理编排、权限策略和Webhook等功能。详情见官方文档。

客户如何使用托管代理

各行业客户已在生产环境中部署Claude托管代理，部分案例包括：

Notion的定制代理直接从任务板分配工作，Claude自动获取相关文档、会议记录和连接数据，完成的代码、演示文稿和网站返回工作区供审阅。数十个任务并行运行，团队称早期原型将约12小时工作压缩至20分钟。
乐天利用托管代理快速上线产品、销售、市场和财务领域的专业代理，每个代理上线时间约一周。
Sentry结合Seer调试代理和Claude代理自动编写补丁及发起PR，由单工程师数周内完成。
Asana构建AI团队成员自动处理项目任务，Atlassian将开发者代理集成至Jira工作流。