Anthropic Claude Opus 4.8

美国Anthropic公司于5月28日(当地时间)发布了其AI模型的新版本“Claude Opus 4.8”。该版本已在所有平台上线,且使用价格保持不变。

Claude Opus 4.8基于前一版本Opus 4.7,提升了编码能力、代理技能和推理等多个基准测试得分。特别是在“诚实性”方面有显著改进,减少了在证据不足时仓促得出结论的情况。初期测试者反馈显示,模型出现无依据主张的概率明显降低。测试结果还表明,模型漏检自身代码缺陷的概率相比上一版本减少了约四分之三。

默认情况下,Claude Opus 4.8的推理努力(Effort)等级设为“高(High)”。在编码时的令牌消耗与4.7版本相当,但性能有所提升。用户也可以手动选择“extra”(在Claude Code中为xhigh)或“max”模式,通过增加令牌消耗获得更优结果。为适应高令牌消耗,Claude Code的速率限制也相应提高。

Claude Opus 4.8界面

此外,网页版“claude.ai”和“Claude Cowork”新增了让用户控制AI任务投入力度的新功能。选择更高的努力等级,AI会进行更深入思考,输出更优质结果;选择较低等级则响应更快,且能有效节约使用额度。

针对AI助手“Claude Code”,Anthropic推出了“动态工作流”功能的研究预览,支持在单个会话中并行运行数百个子代理,从而处理大规模任务。开发者版的Messages API也新增了接受系统条目的功能,允许在任务进行中更新Claude的指令。

价格方面,输入每百万令牌收费5美元,输出每百万令牌收费25美元。运行速度提升至2.5倍的“快速模式”价格为输入每百万令牌10美元,输出每百万令牌50美元。