开发者们为了更好地平衡智能水平与成本,纷纷采用我们称之为“顾问策略”的方法:将 Opus 作为顾问,与 Sonnet 或 Haiku 作为执行者配对使用。这样既能让代理拥有接近 Opus 级别的智能,又能保持接近 Sonnet 级别的成本。

今天,我们在 Claude 平台上推出了顾问工具,使得顾问策略只需在 API 调用中做一行简单修改即可实现。

用顾问策略打造高性价比智能代理

顾问策略示意图

在顾问策略中,Sonnet 或 Haiku 作为执行者负责任务的端到端处理,包括调用工具、读取结果并不断迭代寻找解决方案。当执行者遇到无法合理解决的决策时,会向 Opus 这个顾问寻求指导。Opus 会访问共享上下文,返回计划、修正建议或停止信号,执行者随后继续执行。顾问不会调用工具或直接输出给用户,仅为执行者提供指导。

这种方式颠覆了常见的子代理模式——通常是由更大的协调模型分解任务并分配给较小的工作模型。而在顾问策略中,较小且更具成本效益的模型驱动执行过程,并在必要时升级请求,无需任务分解、工作池或复杂的协调逻辑。前沿级别的推理仅在执行者需要时才调用,其余时间保持执行者级别的成本。

我们的评测显示,Sonnet 搭配 Opus 作为顾问,在 SWE-bench 多语言测试 中的表现比单独使用 Sonnet 提升了 2.7 个百分点,同时每个代理任务的成本降低了 11.9%。

性能与成本对比

顾问工具介绍

我们通过 顾问工具 将顾问策略引入 API,这是一个服务器端工具,Sonnet 和 Haiku 会在需要指导或帮助时调用它。

评测中,Sonnet 搭配 Opus 顾问在 BrowseComp2 和 Terminal-Bench 2.03 基准测试中均有提升,同时每个任务的成本低于单独使用 Sonnet。

顾问工具性能

顾问策略同样适用于以 Haiku 作为执行者的场景。在 BrowseComp 测试中,Haiku 搭配 Opus 顾问的得分为 41.2%,是单独使用 Haiku 19.7% 的两倍多。虽然 Haiku+Opus 的得分比 Sonnet 单独使用低 29%,但每个任务成本却低 85%。顾问策略相较于单独使用 Haiku 会增加一定成本,但整体价格仍远低于 Sonnet,使其成为需要智能与成本平衡的大规模任务的理想选择。

Haiku与Sonnet对比

只需在 Messages API 请求中声明 advisor_20260301,模型切换便在单次 /v1/messages 请求内完成,无需额外的往返或上下文管理。执行者模型决定何时调用顾问,调用时我们会将精心整理的上下文传递给顾问模型,返回计划后执行者继续执行,整个过程在同一请求内完成。

response = client.messages.create(
    model="claude-sonnet-4-6",  # 执行者
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
            "max_uses": 3,
        },
        # ... 其他工具
    ],
    messages=[...]
)

# 顾问模型的 token 使用会单独报告

价格说明:顾问模型的 token 按顾问模型费率计费,执行者模型的 token 按执行者模型费率计费。由于顾问仅生成简短的计划(通常 400-700 个文本 token),而执行者负责完整输出且费率较低,整体成本远低于全程使用顾问模型。

内置成本控制:可通过 max_uses 限制每次请求中顾问调用次数。顾问 token 在使用报告中单独列出,方便按层级跟踪支出。

兼容现有工具:顾问工具只是 Messages API 请求中的一个条目,您的代理可以在同一循环中同时搜索网页、执行代码,并咨询 Opus 顾问。