顾问策略：为智能代理注入智慧助力

开发者们为了更好地平衡智能水平与成本，纷纷采用我们称之为“顾问策略”的方法：将 Opus 作为顾问，与 Sonnet 或 Haiku 作为执行者配对使用。这样既能让代理拥有接近 Opus 级别的智能，又能保持接近 Sonnet 级别的成本。

今天，我们在 Claude 平台上推出了顾问工具，使得顾问策略只需在 API 调用中做一行简单修改即可实现。

用顾问策略打造高性价比智能代理

顾问策略示意图

在顾问策略中，Sonnet 或 Haiku 作为执行者负责任务的端到端处理，包括调用工具、读取结果并不断迭代寻找解决方案。当执行者遇到无法合理解决的决策时，会向 Opus 这个顾问寻求指导。Opus 会访问共享上下文，返回计划、修正建议或停止信号，执行者随后继续执行。顾问不会调用工具或直接输出给用户，仅为执行者提供指导。

这种方式颠覆了常见的子代理模式——通常是由更大的协调模型分解任务并分配给较小的工作模型。而在顾问策略中，较小且更具成本效益的模型驱动执行过程，并在必要时升级请求，无需任务分解、工作池或复杂的协调逻辑。前沿级别的推理仅在执行者需要时才调用，其余时间保持执行者级别的成本。

我们的评测显示，Sonnet 搭配 Opus 作为顾问，在 SWE-bench 多语言测试中的表现比单独使用 Sonnet 提升了 2.7 个百分点，同时每个代理任务的成本降低了 11.9%。

性能与成本对比

顾问工具介绍

我们通过顾问工具将顾问策略引入 API，这是一个服务器端工具，Sonnet 和 Haiku 会在需要指导或帮助时调用它。

评测中，Sonnet 搭配 Opus 顾问在 BrowseComp2 和 Terminal-Bench 2.03 基准测试中均有提升，同时每个任务的成本低于单独使用 Sonnet。

顾问工具性能

顾问策略同样适用于以 Haiku 作为执行者的场景。在 BrowseComp 测试中，Haiku 搭配 Opus 顾问的得分为 41.2%，是单独使用 Haiku 19.7% 的两倍多。虽然 Haiku+Opus 的得分比 Sonnet 单独使用低 29%，但每个任务成本却低 85%。顾问策略相较于单独使用 Haiku 会增加一定成本，但整体价格仍远低于 Sonnet，使其成为需要智能与成本平衡的大规模任务的理想选择。

Haiku与Sonnet对比

只需在 Messages API 请求中声明 advisor_20260301，模型切换便在单次 /v1/messages 请求内完成，无需额外的往返或上下文管理。执行者模型决定何时调用顾问，调用时我们会将精心整理的上下文传递给顾问模型，返回计划后执行者继续执行，整个过程在同一请求内完成。

response = client.messages.create(
    model="claude-sonnet-4-6",  # 执行者
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
            "max_uses": 3,
        },
        # ... 其他工具
    ],
    messages=[...]
)

# 顾问模型的 token 使用会单独报告

价格说明：顾问模型的 token 按顾问模型费率计费，执行者模型的 token 按执行者模型费率计费。由于顾问仅生成简短的计划（通常 400-700 个文本 token），而执行者负责完整输出且费率较低，整体成本远低于全程使用顾问模型。

内置成本控制：可通过 max_uses 限制每次请求中顾问调用次数。顾问 token 在使用报告中单独列出，方便按层级跟踪支出。

兼容现有工具：顾问工具只是 Messages API 请求中的一个条目，您的代理可以在同一循环中同时搜索网页、执行代码，并咨询 Opus 顾问。