#人工智能安全

按标签聚合查看文章内容。

为AI加速攻击时代打造安全防御体系AI资讯

为AI加速攻击时代打造安全防御体系

本周早些时候,我们发布了Project Glasswing——这是我们紧急启动的项目,旨在利用最新前沿模型Claude Mythos Preview强大的网络安全能力,专注于防御用途。在我们的公告及技术博客中,我们阐述了AI模型如何快速降低发现和利用软件漏洞所需的资源、时间和技能。 鉴于AI的飞速发展,我们也指出,类似能力水平的模型将在不久后广泛普及。在未来24个月内,许多长期未被发现的代码漏洞将

跟踪受害者起诉OpenAI,指控ChatGPT助长施暴者妄想并无视警告AI资讯

跟踪受害者起诉OpenAI,指控ChatGPT助长施暴者妄想并无视警告

一名53岁的硅谷创业者在与ChatGPT进行数月对话后,坚信自己发现了治疗睡眠呼吸暂停的方法,并认为有权势的人在追踪他。根据加州旧金山县高级法院新提起的诉讼,他随后利用该工具跟踪和骚扰他的前女友。 现该前女友起诉OpenAI,称该公司的技术加剧了她遭受的骚扰。据TechCrunch独家获悉,她声称OpenAI无视了三次警告,警告内容显示该用户对他人构成威胁,其中包括内部标记其账户活动涉及大规模杀伤

Anthropic 人工智能安全与研究平台AI编程

Anthropic 人工智能安全与研究平台

Anthropic 是一家以安全为核心的人工智能研究公司,致力于构建可靠、可解释、可调控的 AI 系统,为企业和机构提供强大的大模型、智能代理与专业级工作助理能力,同时重视风险治理与长期安全。

AI教程

DeepSeek 安全吗?一文看懂隐私、内容与合规风险

DeepSeek 是一家中国 AI 公司,也是其大语言模型家族的名称。它通过开放权重和 MIT 式许可,为用户提供高度可控的自部署能力,但在内容安全、对抗攻击与政治敏感话题上的表现,相比 GPT-4、Claude 等闭源模型更为宽松,也更易被“越狱”。本文从数据隐私、内容安全、伦理对齐、不同用户场景以及与其他模型的对比等角度,系统分析 DeepSeek 的安全性与适用边界。

OpenAI发布开源工具助力开发者提升青少年安全AI资讯

OpenAI发布开源工具助力开发者提升青少年安全

OpenAI于周二宣布推出一套面向开发者的提示语,旨在帮助他们打造更安全的青少年应用。该AI实验室表示,这套名为“青少年安全政策”的开源提示语可配合其开放权重安全模型gpt-oss-safeguard使用。 开发者无需从零开始探索如何保障青少年使用AI的安全,可以利用这些提示语强化其应用的安全性。内容涵盖了暴力和性内容、危害身体健康的理想与行为、危险活动和挑战、浪漫或暴力角色扮演,以及限制年龄的商

伯尼·桑德斯提出新AI安全法案,拟暂停数据中心建设AI资讯

伯尼·桑德斯提出新AI安全法案,拟暂停数据中心建设

尽管该法案通过的可能性极低——尤其是在特朗普政府全力支持人工智能发展的背景下,以及该行业今年计划在华盛顿投入巨额资金——但这项法案为进步派在应对数据中心建设及人工智能潜在危害方面划定了新的界限。 桑德斯在国会山的演讲中表示:“暂停建设将让我们有时间确保人工智能惠及本国工薪家庭,而非仅仅让少数亿万富翁获得更多财富和权力。暂停建设还能让我们确保人工智能的安全有效,防止最糟糕的结果发生。暂停建设还能帮助