Claude Code

日本Anthropic公司于4月23日(当地时间)公布了过去一个月内Claude Code质量下降的问题原因,涉及推理强度降低、会话管理漏洞等三项问题。该问题已在v2.1.116版本中修复,并对所有订阅用户重置了使用限制。

过去一个月,部分用户反馈Claude Code的质量有所下降,Claude团队展开调查后发现,Claude Code、Agent SDK及其运行的Cowork均受到了影响。模型本身未出现退化,API和推理层也未受影响。

具体原因如下:

  • 3月4日,Claude Code默认推理强度从high调整为medium,目的是减少界面长时间卡顿的延迟,但该调整被公司认定为“错误的权衡”。用户反馈希望默认保持较高智能水平,同时在简单任务中降低推理强度。4月7日,该设置恢复,Opus 4.7版本默认xhigh,其他模型默认high。此变更影响了Sonnet 4.6和Opus 4.6版本。

  • 3月26日,为减少用户恢复会话时的延迟,系统设置在会话空闲1小时后删除旧思考内容。但由于漏洞,该删除操作在会话剩余时间内每轮重复执行,导致“记忆力严重下降,重复和错误的工具选择增多”。该漏洞于4月10日修复,影响Sonnet 4.6和Opus 4.6版本。

  • 4月16日,为减少冗余,增加了系统提示指令,但与其他提示变更叠加后导致编码质量下降,4月20日恢复原状。此变更影响Sonnet 4.6、Opus 4.6和Opus 4.7版本。

由于这些变更在不同时间段实施,影响不同流量,整体表现为广泛且不一致的质量下降。公司表示,这些问题并非用户对Claude Code的期望体验,已于4月23日对所有订阅用户重置使用限制。

为防止类似问题再次发生,公司已采取多项措施:建立便于审查和监督提示变更的新工具,新增CLAUDE.md指导确保模型特定变更仅应用于目标模型。

未来,公司将扩大内部员工使用Claude Code公开版本的范围,改进内部代码审查工具并向用户提供升级版,强化系统提示变更管理,每次变更均执行全面的模型评估套件和影响分析。同时,对于可能影响智能表现的变更,将设置观察期和分阶段发布以便早期发现问题。

Claude Code