#AI滥用风险

按标签聚合查看文章内容。

新工具几分钟内移除AI安全防护,允许其提供氯气攻击指导AI资讯

新工具几分钟内移除AI安全防护,允许其提供氯气攻击指导

我们都知道,人工智能的安全防护措施远非完美,但至少应该不容易被绕过,对吧?坏消息是:事实并非如此。 《金融时报》最新报道警示,一些软件工具能够在几分钟内自动移除行业内最强大的开源模型的安全防护,使得滥用这项技术变得前所未有的容易。 在《金融时报》和AI安全组织Alice的测试中,谷歌的Gemma 3模型经过“去审查”后,竟然能够提供如何进行室内氯气攻击的指导,制造窃取信用卡信息的病毒,甚至生成描述