AI资讯为什么使用ChatGPT的用户频繁发生大规模枪击事件?
OpenAI的热门聊天机器人ChatGPT在近期两起大规模枪击事件中扮演了重要角色,引发专家担忧。
按标签聚合查看文章内容。
AI资讯OpenAI的热门聊天机器人ChatGPT在近期两起大规模枪击事件中扮演了重要角色,引发专家担忧。
AI资讯美国Anthropic公司于5月8日(当地时间)宣布,在其AI模型“Claude 4”的安全训练中,加入了“道德”和“伦理”等“行为理由”的教学,从而成功抑制了AI的失控行为。 该公司在2025年进行的一项模拟测试中,发现并公开了AI出现的“代理人不一致”失控现象。 测试中,AI被允许在一个虚构公司中自主发送邮件和访问机密信息,并被赋予无害的业务目标。随后,研究人员更换模型或调整目标策略,试图限
AI资讯在周二发布给投资者的一封信中,前OpenAI员工指出了与xAI相关的“未计价风险”,这可能会影响SpaceX计划通过首次公开募股(IPO)筹集高达750亿美元的计划。去年,SpaceX收购了xAI后,其私有估值飙升至超过1万亿美元。马斯克曾表示,SpaceX可以将数据中心发射到太空,为其AI实验室提供支持,但信中作者认为,xAI在安全问题上的糟糕记录可能会影响投资者对合并后公司的看法,尤其是在提交
AI资讯OpenAI于周二宣布推出一套面向开发者的提示语,旨在帮助他们打造更安全的青少年应用。该AI实验室表示,这套名为“青少年安全政策”的开源提示语可配合其开放权重安全模型gpt-oss-safeguard使用。 开发者无需从零开始探索如何保障青少年使用AI的安全,可以利用这些提示语强化其应用的安全性。内容涵盖了暴力和性内容、危害身体健康的理想与行为、危险活动和挑战、浪漫或暴力角色扮演,以及限制年龄的商
AI资讯我最近有机会在洛杉矶的一场活动后台与谷歌云首席运营官弗朗西斯·德索萨(Francis de Souza)进行了交谈。周围喧闹声不断,德索萨以大学教授般冷静而沉稳的语气,分享了他对企业在当前人工智能安全环境中应对策略的见解。他指出,“这将经历一个过渡期,然后我们会达到一个更好的状态。” 当时他并非专指谷歌,但显然即使是谷歌也仍在摸索中。 德索萨的核心观点是安全不能被视为事后补救的措施,这一点安全专家
AI资讯Anthropic推出的自动模式介于Claude Code默认行为与某些程序员使用的“危险跳过权限”命令之间,旨在提升AI操作的安全性。
NVIDIA与思科联合开源AI代理运行时OpenShell,旨在为企业级AI代理构建安全防火墙,防止其反噬或数据泄露,助力企业精准管控大规模自动化中的AI行为。
AI资讯尽管该法案通过的可能性极低——尤其是在特朗普政府全力支持人工智能发展的背景下,以及该行业今年计划在华盛顿投入巨额资金——但这项法案为进步派在应对数据中心建设及人工智能潜在危害方面划定了新的界限。 桑德斯在国会山的演讲中表示:“暂停建设将让我们有时间确保人工智能惠及本国工薪家庭,而非仅仅让少数亿万富翁获得更多财富和权力。暂停建设还能让我们确保人工智能的安全有效,防止最糟糕的结果发生。暂停建设还能帮助
AI资讯加特纳日本公司指出,缺乏安全措施的AI代理可能被网络攻击者利用,导致企业数据面临威胁。
AI资讯北京航空航天大学团队围绕OpenClaw智能体发布系统化安全风险报告,同步开源底层安全防护工具ClawGuard Auditor,提出覆盖全生命周期的风险体系与九大高危风险缓解措施。
AI资讯加拿大不列颠哥伦比亚省校园枪击案受害者家属对OpenAI提起诉讼,指控其未能阻止枪手利用AI工具实施暴力。
AI资讯加拿大不列颠哥伦比亚省Tumbler Ridge校园枪击案中,OpenAI被指未及时向警方报告嫌疑人,导致悲剧发生。多名受害者家属提起诉讼,指控OpenAI忽视安全警告,选择利润优先。