Anthropic于周四发布了最新版本的公开高级模型Opus 4.8。该模型已在全球范围内上线,定价维持在与之前Opus版本相同的标准水平。

此次更新距离Opus 4.7发布仅41天,升级周期明显加快。相比之下,Anthropic之前发布的Sonnet和Haiku模型分别已有三个月和七个月历史。此次快速迭代或与Opus 4.7的市场反响不佳有关,部分用户对其表现感到失望。

这段时间内,OpenAI的Codex和谷歌的Gemini Flash模型也相继推出新版本,进一步加剧了Anthropic保持竞争力的压力。

Opus 4.8不仅在各项基准测试中表现优异,还特别关注模型对错误或不确定数据的处理能力。Anthropic的早期测试者发现,新模型更倾向于主动标记不确定性,减少无根据的断言。

Bridgewater的合作伙伴也表示,升级最大的不同在于“Opus 4.8能够主动指出分析输入和输出中的问题,而其他模型通常忽视这些,需要用户自行发现”。

同时,Anthropic推出了名为“动态工作流”的新功能,目前处于研究预览阶段。该系统旨在帮助Opus等大型模型管理数百个并行子代理,处理复杂任务。

官方介绍称,“结合Claude Code,Opus 4.8现可完成跨越数十万行代码的代码库级迁移,从启动到合并,均以现有测试套件为标准”。

尽管Anthropic仍在推迟发布其最先进的Mythos模型,原因是上月的初步预览引发了网络安全担忧,但公司在此次Opus发布中暗示,一旦必要的安全措施完成,Mythos的预览期可能很快结束。

公司表示:“我们正在迅速推进这些安全措施的开发,预计未来几周内即可向所有客户提供Mythos级别的模型。”