将一个智能代理投入生产环境,远不止拥有一个好的提示词那么简单。代理需要有运行其生成代码的环境,访问数据的凭证,可观察的会话,以及能够随使用量扩展的基础设施。在Anthropic的应用AI团队,我们处于产品、研究和客户构建Claude应用的交汇点,反复观察到一个规律:基础设施是区分原型和生产代理的关键。许多团队常常在安全、状态管理、权限控制和代理框架调优上消耗大量开发周期。

Claude托管代理是一套可组合的API,专为构建和部署生产级代理设计。它将针对性能调优的代理框架与生产基础设施结合,使团队能够在几天内完成从原型到上线的转变,而非数月。本文将介绍Anthropic智能代理构建模块的演进历程、我们为何开发Claude托管代理,以及团队如何在生产环境中使用它。

智能代理架构的演进

2023年,我们向开发者开放Claude时,API设计非常简洁:输入token,输出token。你发送提示,Claude返回完成内容,剩下的代理框架和基础设施由你搭建。

随着时间推移,API功能逐渐丰富,但底层契约未变:一次请求对应模型一次响应,应用决定下一步操作。对于文档摘要、支持工单分类、文本重写等单轮任务,这种方式足够用。

然而,用户需求逐渐超出单轮任务。他们希望Claude能完成整个任务流程:查询信息、执行操作、观察变化并决定下一步,还希望它能直接在现有系统中运行,如代码库、内部维基或工单系统。

使用API时,将Claude变成代理意味着你必须自己构建循环:询问模型下一步、运行工具、反馈结果、重复执行。你需要负责代理框架的搭建和部署,且随着模型演进可能需要调优。对于需要高度定制的代理,这种方式合理;但对于更可预测、复杂度较低的任务,持续调优框架变得繁琐。

Claude消息API

2025年,我们推出了Claude Code,这是一个让Claude直接与代码库交互的智能编码工具,内置了自己的代理框架:循环、工具执行、子代理、上下文管理及丰富功能,使其成为高效代理。开发者自然希望在各自领域拥有类似的框架支持。

为此,我们发布了Claude Agent SDK,让开发者基于Claude Code的框架构建自己的代理,而无需维护自研循环。对许多团队来说,这标志着代理变得实用:框架已针对Claude调优,配备基础设施原语,并随着Claude Code持续改进。

即便有框架,生产环境部署代理仍面临挑战:

  • 托管与扩展:代理运行在哪?多小时任务进程如何存活?使用量增长时如何扩展?
  • 会话管理:代理的历史和进度存储在哪里?中断后能否无缝恢复?能否回溯查看历史会话?
  • 文件系统管理:代理执行任务会产生文件、代码等产物,工作空间如何管理?运行间工作区如何处理?
  • 执行隔离:Claude生成的代码在哪里执行?出错时影响范围多大?生产环境中信任的边界是什么?
  • 凭证管理:代理如何安全访问系统?如何避免凭证泄露?
  • 可观测性:代理自主运行时,能否重构其每一步操作?

Agent SDK通过Claude Code的机制解决了部分问题:代理拥有真实文件系统,会话状态可本地或外部存储持久化,且通过OpenTelemetry支持导出到现有监控系统。

Claude Agent SDK架构

但随着团队将代理从本地开发推向生产环境,需求转向可扩展且托管的基础设施。模型和框架日益复杂,运行时间更长、执行更多代码、涉及更多系统和操作,扩展、安全和沙箱隔离难度加大。

这些挑战部分源于架构设计:代理框架通常与其操作的文件系统运行在同一容器内。容器启动需时间,代理和代码执行与凭证共存,容器终止即任务终止。

托管代理通过将“大脑”与“执行手”分离解决了这些问题。调用Claude的框架独立于代码执行的沙箱,二者通过会话——一个追加日志,记录所有模型调用、工具调用及结果——连接。Claude可在容器启动前开始推理,沙箱远离凭证,且可随时重建整个运行过程。

Claude托管代理架构

何时及为何使用Claude托管代理

使用托管代理时,用户定义任务、工具和安全策略,Anthropic负责在基础设施上运行代理及其循环:如何为代理提供执行环境调用工具,如何失败恢复,多代理协调等。

当框架未随模型智能演进时,代理会失效。例如,Claude Sonnet 4.5版本中,代理在接近上下文限制时急于完成,导致工作被截断,称为“上下文焦虑”。我们通过添加上下文重置机制解决,但该假设在后续模型Claude Opus 4.5中不再适用,重置反而成了负担。

对大多数组织而言,维护框架是额外负担,且无法成为产品差异化。框架需针对特定模型行为调优;Claude的压缩、工具执行和缓存机制与其他模型不同。Claude托管代理让框架随模型演进,团队可专注于差异化要素:上下文管理和领域专业知识

托管代理围绕三大资源构建:代理(agent)、环境(environment)和会话(session)。代理是配置:模型、提示、工具及安全策略。环境是代理运行的执行上下文:沙箱容器、网络规则及预装包,托管于Anthropic云或用户自有基础设施。每次运行即为会话,绑定代理与环境,拥有独立沙箱实例。会话在服务器端持久保存事件历史、沙箱状态和输出,支持长时间任务的暂停、恢复及逐步追踪。定义一次代理和环境后,可针对同一配置运行多个会话,满足负载增长需求。

代理、环境与会话示意

在托管代理上构建生产级和可扩展应用

在应用AI团队,我们见证代理从原型到生产的过程,涵盖Anthropic内部及客户系统,涉及编码、金融、支持、法律等多个领域。这让我们清晰了解演示与生产代理的差异及团队常遇瓶颈。

以下是选择Claude托管代理的主要理由:

  1. 凭证安全隔离。单容器运行时,Claude生成的代码与凭证共存,存在提示注入风险,可能导致凭证泄露。虽然可在容器内设置防护,但架构分离更安全。凭证存储于独立保险库,代理通过代理服务按需获取解密。托管代理内置凭证保险库,无需自建密钥库,避免频繁传输令牌,且可追踪代理代表的终端用户。凭证采用信封加密,访问需签名请求令牌验证。

托管代理运行时架构

  1. 降低延迟,消除沙箱启动开销。延迟对企业用户体验至关重要。无托管架构时,每次会话都需启动容器,哪怕代理仅需思考不调用工具,启动时间也浪费用户等待。托管代理允许Claude在环境启动同时开始推理,不调用工具的会话跳过容器启动。测试显示,中位数响应时间缩短约60%,最慢响应缩短超过90%。

  2. 可靠持久的会话支持管理、可观测性和记忆功能。托管代理采用事件流模型,会话为持续事件流:每次模型调用、工具调用及结果均追加至外部日志。该架构支持实时更新,支持随时恢复,无需管理数据库或保存点。会话历史持续保存,空闲时容器检查点,支持无缝续接。完整事件记录带来内建可观测性和记忆功能:Claude开发者控制台提供会话时间线视图和深度调试体验。托管代理还支持记忆和梦境功能,后者定期分析会话和记忆库,提炼模式,帮助代理持续改进。

  3. 灵活支持Anthropic托管或自托管云容器。默认情况下,托管代理可将编排和工具执行委托给Anthropic云容器,简化托管和扩展,快速上线。由于“大脑”与“执行手”分离,执行环境可部署在用户虚拟私有云(VPC)内。我们提供自托管沙箱,确保代理代码、文件系统和网络流量不离开用户环境。通过MCP隧道,Claude可连接运行在私有网络内的模型上下文协议服务器,实现对执行位置和访问路径的精细控制。

托管代理架构示意

此外,托管代理还支持代理自评分、多代理编排、权限策略和Webhook等功能。详情见官方文档

客户如何使用托管代理

各行业客户已在生产环境中部署Claude托管代理,部分案例包括:

  • Notion的定制代理直接从任务板分配工作,Claude自动获取相关文档、会议记录和连接数据,完成的代码、演示文稿和网站返回工作区供审阅。数十个任务并行运行,团队称早期原型将约12小时工作压缩至20分钟。
  • 乐天利用托管代理快速上线产品、销售、市场和财务领域的专业代理,每个代理上线时间约一周。
  • Sentry结合Seer调试代理和Claude代理自动编写补丁及发起PR,由单工程师数周内完成。
  • Asana构建AI团队成员自动处理项目任务,Atlassian将开发者代理集成至Jira工作流。

快速开始使用Claude托管代理

我们打造托管代理,旨在通过Claude Code和Claude开发者控制台(platform.claude.com)让启动代理变得极其简单。控制台的快速入门支持从代理模板或自然语言描述开始,数分钟内生成可安全部署的生产级代理。

快速入门界面

代理配置界面

在Claude Code中,默认提供 /claude-api 技能,为构建托管代理应用提供详尽、最新的参考资料。强烈建议使用该技能,遵循最佳实践。可通过运行/claude-api managed-agents-onboard启动面试式引导,帮助从零配置新代理。

Claude API技能示例

托管代理构建的未来

随着团队分享他们基于托管代理的成果,我们看到他们将过去花费在生产基础设施上的时间,转向了差异化代理的核心——上下文管理和用户体验定制。新模型发布时,只需更新代理使用该模型,重新评估并发布改进,无需触及底层架构。

我们期待看到你们的创新成果。

立即开始使用Claude托管代理

本文作者为Anthropic应用AI团队技术成员Gagan Bhat和Isabella He,感谢Hema Thanki、Jess Yan和Molly Vorwerck的贡献。