AI资讯第9回:什么是“提示注入”——欺骗AI的指令文,新兴的安全风险
提示注入是一种通过恶意指令操控AI行为的攻击方式,随着AI在企业中的广泛应用,这种安全风险日益突出。
按标签聚合查看文章内容。
AI资讯提示注入是一种通过恶意指令操控AI行为的攻击方式,随着AI在企业中的广泛应用,这种安全风险日益突出。
AI资讯前沿的AI模型正在将从漏洞发现到被利用的时间缩短,从几个月压缩到几小时。采用这些工具的防御者能够更快地发现和修复漏洞;而攻击者如果使用这些工具,或者等待防御者发布补丁后逆向分析利用漏洞,也能加快攻击速度。这已经不是未来的问题:目前的模型已经能够发现传统工具和人工审查多年未能发现的严重漏洞。 这种加速对任何部署AI代理的组织来说尤为重要。代理运行的基础设施同样面临AI加速的攻击威胁,而代理本身具备自
AI资讯生成式AI在企业中的应用日益广泛,Claude的使用率显著提升。
AI资讯Anthropic警告AI技术可能失控,倡议全球暂停前沿AI研发以加强安全监管。
AI资讯本文探讨了OpenAI宣布弃用微调API背后的行业变化,以及AI模型训练、推理和应用领域的新动态。
AI资讯2016年,谷歌DeepMind开发的人工智能程序AlphaGo通过自我学习掌握了围棋这项极其复杂的游戏,其能力远超简单模仿。 David Silver随后创立了自己的公司Ineffable Intelligence,致力于打造更通用的超级智能AI。Silver表示,公司将专注于强化学习,这是一种通过试错让AI模型学习新能力的方法。其愿景是创造出在多个领域超越人类智能的“超级学习者”。 这种方法与
AI资讯美国Fortinet公司于当地时间26日宣布,扩展其安全设备系列,推出专为保护和扩展最新企业网络设计的新产品——FortiGate 3500G和FortiGate 400G。 这两款新设备针对日益增长的加密流量、AI驱动的工作负载及分布式环境,提供高性能安全防护,增强混合基础设施的整体保护能力,同时保持性能稳定并简化运营。 产品配备了网络处理器NP7,负责防火墙策略控制和VPN处理;安全处理器SP
AI资讯Anthropic最新研究表明,Claude模型内部存在类似人类情感的数字化表示,如快乐、悲伤、喜悦和恐惧,这些情感在人工神经元群中形成,并会根据不同的提示被激活。 该公司研究人员深入分析了Claude Sonnet 4.5的内部机制,发现所谓的“功能性情感”似乎会影响Claude的行为,进而改变模型的输出和反应。 Anthropic的发现有助于普通用户理解聊天机器人是如何运作的。例如,当Clau
AI资讯约翰·奥利弗在最新一期节目中犀利批评了AI聊天机器人,揭露其潜在危害和行业乱象。
AI资讯你可以通过产品发布来衡量一年,也可以通过那些改变我们看待人工智能方式的重要时刻来衡量。今年,人工智能行业不断涌现重大新闻,包括大型收购、独立开发者的成功、公众对可疑产品的抗议,以及存在潜在风险的合同谈判——这些信息纷繁复杂,本文将带你回顾今年迄今为止的关键事件。 Anthropic与五角大楼的对峙 曾经的商业伙伴,Anthropic首席执行官达里奥·阿莫代(Dario Amodei)与美国国防部长
AI资讯伦敦一位艺术家在地铁车厢内张贴假冒OpenAI广告,质疑ChatGPT与青少年自杀事件的关联,引发公众对AI技术安全性的关注。
AI资讯谷歌于周二发布了Gemini 3.5 Flash,这是一款公司迄今为止最强大的AI模型,专注于编程和自主AI代理。该模型在谷歌年度开发者大会Google I/O上亮相,能够独立执行编程流程、管理研究项目,并在内部测试中实现从零开始构建操作系统。 此次发布标志着谷歌从将AI定位为对话工具,转向将AI视为具备自主行动能力的工具。它不仅能回答问题,更能在极少人工干预下进行规划、构建和迭代实际工作。 De