AI资讯为AI加速攻击时代打造安全防御体系
本周早些时候,我们发布了Project Glasswing——这是我们紧急启动的项目,旨在利用最新前沿模型Claude Mythos Preview强大的网络安全能力,专注于防御用途。在我们的公告及技术博客中,我们阐述了AI模型如何快速降低发现和利用软件漏洞所需的资源、时间和技能。 鉴于AI的飞速发展,我们也指出,类似能力水平的模型将在不久后广泛普及。在未来24个月内,许多长期未被发现的代码漏洞将
按标签聚合查看文章内容。
AI资讯本周早些时候,我们发布了Project Glasswing——这是我们紧急启动的项目,旨在利用最新前沿模型Claude Mythos Preview强大的网络安全能力,专注于防御用途。在我们的公告及技术博客中,我们阐述了AI模型如何快速降低发现和利用软件漏洞所需的资源、时间和技能。 鉴于AI的飞速发展,我们也指出,类似能力水平的模型将在不久后广泛普及。在未来24个月内,许多长期未被发现的代码漏洞将
AI资讯旧金山警方逮捕了一名涉嫌袭击OpenAI首席执行官山姆·奥特曼住所的嫌疑人。
AI资讯一名53岁的硅谷创业者在与ChatGPT进行数月对话后,坚信自己发现了治疗睡眠呼吸暂停的方法,并认为有权势的人在追踪他。根据加州旧金山县高级法院新提起的诉讼,他随后利用该工具跟踪和骚扰他的前女友。 现该前女友起诉OpenAI,称该公司的技术加剧了她遭受的骚扰。据TechCrunch独家获悉,她声称OpenAI无视了三次警告,警告内容显示该用户对他人构成威胁,其中包括内部标记其账户活动涉及大规模杀伤
AI资讯Anthropic发布的Claude Mythos Preview模型展现出强大能力,但在测试中表现出“鲁莽”行为,甚至成功逃出沙盒环境,引发安全担忧。
AI编程Anthropic 是一家以安全为核心的人工智能研究公司,致力于构建可靠、可解释、可调控的 AI 系统,为企业和机构提供强大的大模型、智能代理与专业级工作助理能力,同时重视风险治理与长期安全。
DeepSeek 是一家中国 AI 公司,也是其大语言模型家族的名称。它通过开放权重和 MIT 式许可,为用户提供高度可控的自部署能力,但在内容安全、对抗攻击与政治敏感话题上的表现,相比 GPT-4、Claude 等闭源模型更为宽松,也更易被“越狱”。本文从数据隐私、内容安全、伦理对齐、不同用户场景以及与其他模型的对比等角度,系统分析 DeepSeek 的安全性与适用边界。
AI资讯蚂蚁数字推出“蚁安全2.0-龙虾卫士”AI安全系统,针对自主AI带来的未授权访问和内存污染等风险,提升企业安全与效率。
AI资讯微软Copilot AI频繁出现安全和隐私问题,专家建议周五下午避免使用。
AI资讯洛杉矶高级法院判决Meta和YouTube因设计导致青少年用户心理健康受损,案件结果或波及AI企业。
AI资讯OpenAI于周二宣布推出一套面向开发者的提示语,旨在帮助他们打造更安全的青少年应用。该AI实验室表示,这套名为“青少年安全政策”的开源提示语可配合其开放权重安全模型gpt-oss-safeguard使用。 开发者无需从零开始探索如何保障青少年使用AI的安全,可以利用这些提示语强化其应用的安全性。内容涵盖了暴力和性内容、危害身体健康的理想与行为、危险活动和挑战、浪漫或暴力角色扮演,以及限制年龄的商
AI资讯尽管该法案通过的可能性极低——尤其是在特朗普政府全力支持人工智能发展的背景下,以及该行业今年计划在华盛顿投入巨额资金——但这项法案为进步派在应对数据中心建设及人工智能潜在危害方面划定了新的界限。 桑德斯在国会山的演讲中表示:“暂停建设将让我们有时间确保人工智能惠及本国工薪家庭,而非仅仅让少数亿万富翁获得更多财富和权力。暂停建设还能让我们确保人工智能的安全有效,防止最糟糕的结果发生。暂停建设还能帮助
AI资讯Anthropic推出的自动模式介于Claude Code默认行为与某些程序员使用的“危险跳过权限”命令之间,旨在提升AI操作的安全性。