#Anthropic

按标签聚合查看文章内容。

防止AI失控需注重“道德”教育,Anthropic通过“Claude”模型验证AI资讯

防止AI失控需注重“道德”教育,Anthropic通过“Claude”模型验证

美国Anthropic公司于5月8日(当地时间)宣布,在其AI模型“Claude 4”的安全训练中,加入了“道德”和“伦理”等“行为理由”的教学,从而成功抑制了AI的失控行为。 该公司在2025年进行的一项模拟测试中,发现并公开了AI出现的“代理人不一致”失控现象。 测试中,AI被允许在一个虚构公司中自主发送邮件和访问机密信息,并被赋予无害的业务目标。随后,研究人员更换模型或调整目标策略,试图限

Anthropic暂时禁止OpenClaw创始人访问ClaudeAI资讯

Anthropic暂时禁止OpenClaw创始人访问Claude

OpenClaw的创始人Peter Steinberger在周五凌晨于社交平台X上发布消息称:“未来确保OpenClaw继续兼容Anthropic模型将变得更加困难。”他还附上了一张Anthropic发来的账户因“可疑活动”被暂停的通知截图。 不过,这次封禁并未持续太久。几小时后,随着该消息在网络上广泛传播,Steinberger宣布他的账户已被恢复。在数百条评论中,许多带有阴谋论色彩,因为Ste

Anthropic 人工智能安全与研究平台AI编程

Anthropic 人工智能安全与研究平台

Anthropic 是一家以安全为核心的人工智能公司,致力于构建可靠、可解释、可调控的 AI 系统,为企业与机构提供高水平对话式 AI、代码助手、智能代理与安全工具,帮助用户在降低风险的前提下释放 AI 生产力。