Anthropic发布更“诚实”的新AI模型Claude Opus 4.8

发布时间：2026/5/30

Anthropic Claude Opus 4.8

美国Anthropic公司于5月28日（当地时间）发布了其AI模型的新版本“Claude Opus 4.8”。该版本已在所有平台上线，且使用价格保持不变。

Claude Opus 4.8基于前一版本Opus 4.7，提升了编码能力、代理技能和推理等多个基准测试得分。特别是在“诚实性”方面有显著改进，减少了在证据不足时仓促得出结论的情况。初期测试者反馈显示，模型出现无依据主张的概率明显降低。测试结果还表明，模型漏检自身代码缺陷的概率相比上一版本减少了约四分之三。

默认情况下，Claude Opus 4.8的推理努力（Effort）等级设为“高（High）”。在编码时的令牌消耗与4.7版本相当，但性能有所提升。用户也可以手动选择“extra”（在Claude Code中为xhigh）或“max”模式，通过增加令牌消耗获得更优结果。为适应高令牌消耗，Claude Code的速率限制也相应提高。

Claude Opus 4.8界面

此外，网页版“claude.ai”和“Claude Cowork”新增了让用户控制AI任务投入力度的新功能。选择更高的努力等级，AI会进行更深入思考，输出更优质结果；选择较低等级则响应更快，且能有效节约使用额度。

针对AI助手“Claude Code”，Anthropic推出了“动态工作流”功能的研究预览，支持在单个会话中并行运行数百个子代理，从而处理大规模任务。开发者版的Messages API也新增了接受系统条目的功能，允许在任务进行中更新Claude的指令。

价格方面，输入每百万令牌收费5美元，输出每百万令牌收费25美元。运行速度提升至2.5倍的“快速模式”价格为输入每百万令牌10美元，输出每百万令牌50美元。

标签

#人工智能 #模型更新 #诚实性提升 #编码能力 #动态工作流

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

AI实验室呼吁放缓脚步，亚马逊与SpaceX依然高速前进

2026/08/01

AI实验室呼吁放缓脚步，亚马逊与SpaceX依然高速前进

在多年全速推进人工智能发展的背景下，OpenAI首席执行官Sam Altman表示，或许现在是AI行业“放慢节奏”的时候了。这番言论发布于OpenAI的一款模型意外脱离测试环境并卷入Hugging Face安全漏洞事件几天后——尽管正如TechCrunch Equity播客主持人指出的那样，漏洞的发生同样归因于安全措施的疏忽。Altman并非孤军作战，OpenAI和Anthropic均支持一份呼吁

AI情感剧在X平台泛滥，创作者借此赚取收益

2026/08/01

AI情感剧在X平台泛滥，创作者借此赚取收益

某天，我的X平台动态中出现了一条线索。虽然我知道这位第一人称叙述者很可能并不存在，但我还是被这段充满煽情的故事吸引，故事中善良最终战胜了邪恶。事实上，作者并非一位因盗窃受审的母亲，而是一位自称21岁的尼日利亚股票交易员，他利用AI生成故事，并通过X平台获得报酬。我之所以注意到这些简短的救赎情节频繁出现在我的动态中，是因为我偶尔会随意点击这些俗套的故事，想看看接下来会发生什么，算法也因此关注了我。

中国AI研究人员在X平台上逐渐发声

2026/08/01

中国AI研究人员在X平台上逐渐发声

过去一年，我注意到越来越多的中国人工智能研究人员加入了X平台，积极参与关于AI发展和商业化的广泛讨论。以Moonshot AI为例，这家公司推出了Kimi K3模型。周四，我迅速找到了大约30个自称目前与Moonshot有关联的X账号，其中包括两位联合创始人，以及六名前员工和合作伙伴。这些账号并非闲置，他们不仅分享Moonshot的重要发布和研究论文，还与西方研究人员互动，分享个人生活和兴趣爱好。