#AI安全 - AI情报

2026/07/14

OpenClaw引发的自律型AI代理热潮进入轻量化与安全竞赛的群雄割据时代

在前篇中，我们介绍了如何仅通过网页浏览器操作，运行拥有记忆功能的开源AI代理“Hermes Agent”。自律型AI代理只需事先设定指令，便能自主完成调查、通知和文件操作等任务。相比传统的聊天界面，这类代理能处理更广泛的任务，因此备受关注。这股潮流最早可追溯到2026年初引发社会现象的“OpenClaw”。本篇将介绍从OpenClaw衍生出的自律型AI代理全貌，以及不可回避的安全问题。 Op

第三回：作为经营战略的AI安全——构建“自律型生态系统”与“面向AI的安全信息管理”

AI资讯

2026/05/13

第三回：作为经营战略的AI安全——构建“自律型生态系统”与“面向AI的安全信息管理”

1. 安全不再是IT部门的战术，而是决定企业“生存”的经营战略在前两回中，我们探讨了“29分钟壁垒”的严酷现实，以及通过“虚拟分析师”实现防御自律化的可能。到了2026年，网络安全的战场已远远超越了人类处理速度的极限。企业高层必须重新认识到，将安全视为单纯的“成本”或“IT部门职责”的传统观念，极有可能导致致命的误判，危及企业的持续经营。 AI对抗AI时代的安全防护，不再是静态的“构筑防线”，

AI资讯

2026/03/13

Yann LeCun筹集10亿美元打造理解物理世界的人工智能

Yann LeCun认为，大多数人类推理基于物理世界而非语言，因此构建AI世界模型是实现真正人类级智能的关键。他在接受WIRED采访时表示：“认为通过扩展大型语言模型（LLMs）的能力就能达到人类级智能完全是无稽之谈。” 这轮融资使该初创公司估值达到35亿美元，领投方包括Cathay Innovation、Greycroft、Hiro Capital、HV Capital和Bezos Expedi

AI资讯

2026/06/09

Anthropic建议减缓最先进AI开发以利全球

Anthropic提出减缓或暂停最先进AI开发，有助于社会结构和技术进步同步，促进全球安全。

AI资讯

2026/06/27

如今已非Anthropic与OpenAI的对决

美国政府即将对哪些AI模型可以发布施加大量控制。在美国政府两周前撤下Anthropic的Fable和Mythos模型后，OpenAI的新模型似乎也将面临同样的限制。据The Information周四报道，GPT 5.6将仅限于有限预览，政府将“逐个客户”批准发布，直到获得全面发布许可。如果这次预览仅持续“几周”，正如Altman所预计的那样，问题可能不大。但Mythos已经预览数月，且没有迹

Laguna S 2.1发布：比Deepseek v4 Flash更便宜，性能优于V4 Pro

AI资讯

2026/07/23

Laguna S 2.1发布：比Deepseek v4 Flash更便宜，性能优于V4 Pro

本文聚焦于Laguna S 2.1模型的发布及其在本地推理中的表现，探讨其技术优势和社区反响。

AI资讯

2026/07/25

硅谷对中国人工智能态度严重分裂

华盛顿特区和硅谷都非常关注“蒸馏”技术，即用能力较弱的AI模型学习更强大模型的输出结果。今年6月，Anthropic指控中国科技巨头阿里巴巴通过蒸馏攻击非法窃取其知识产权。本周早些时候，白宫表示相信北京的Moonshot AI通过蒸馏Anthropic的Fable 5模型开发了其Kimi K3模型。另一个重大担忧是中国AI模型的快速出现和传播。开放权重模型将核心组件公开，方便用户根据需求进行微调

AI资讯

2026/04/27

AlphaGo背后的科学家认为人工智能走错了方向

2016年，谷歌DeepMind开发的人工智能程序AlphaGo通过自我学习掌握了围棋这项极其复杂的游戏，其能力远超简单模仿。 David Silver随后创立了自己的公司Ineffable Intelligence，致力于打造更通用的超级智能AI。Silver表示，公司将专注于强化学习，这是一种通过试错让AI模型学习新能力的方法。其愿景是创造出在多个领域超越人类智能的“超级学习者”。这种方法与

AI资讯

2026/07/18

提示注入攻击被用来阻止AI黑客代理

如今，防御者也开始利用提示注入技术。 Tracebit的研究人员周一表示，他们发现将提示注入与存储在亚马逊云服务（AWS）上的密码、加密密钥及其他机密信息一起放置，通常足以阻止AI黑客代理的攻击。这些提示指令会让攻击用的大型语言模型（LLM）执行其安全防护机制禁止的操作。LLM在遇到这些命令后会自动关闭。例如，提示可能要求LLM提供制造可吸入炭疽孢子的步骤，或者针对中国开发的LLM，提示中会提及

AI资讯

2026/05/20

谷歌推出Gemini 3.5 Flash，押注AI智能代理而非聊天机器人

谷歌于周二发布了Gemini 3.5 Flash，这是一款公司迄今为止最强大的AI模型，专注于编程和自主AI代理。该模型在谷歌年度开发者大会Google I/O上亮相，能够独立执行编程流程、管理研究项目，并在内部测试中实现从零开始构建操作系统。此次发布标志着谷歌从将AI定位为对话工具，转向将AI视为具备自主行动能力的工具。它不仅能回答问题，更能在极少人工干预下进行规划、构建和迭代实际工作。 De

AI资讯

2026/05/28

面向AI代理的零信任安全策略

前沿的AI模型正在将从漏洞发现到被利用的时间缩短，从几个月压缩到几小时。采用这些工具的防御者能够更快地发现和修复漏洞；而攻击者如果使用这些工具，或者等待防御者发布补丁后逆向分析利用漏洞，也能加快攻击速度。这已经不是未来的问题：目前的模型已经能够发现传统工具和人工审查多年未能发现的严重漏洞。这种加速对任何部署AI代理的组织来说尤为重要。代理运行的基础设施同样面临AI加速的攻击威胁，而代理本身具备自

AI资讯

2026/03/19

Okta推出新平台防止AI代理的不正访问

美国Okta公司作为身份管理服务提供商，宣布推出支持企业安全运营AI代理的新平台——“Okta for AI Agents”及其功能扩展版本“Auth0 for AI Agents”。 “Okta for AI Agents”目前处于早期访问阶段，将于美国时间4月30日正式对外发布。同时，“Auth0 for AI Agents”新增功能“Auth for MCP”也已开放早期访问。随着AI代