谷歌于周二发布了Gemini 3.5 Flash,这是一款公司迄今为止最强大的AI模型,专注于编程和自主AI代理。该模型在谷歌年度开发者大会Google I/O上亮相,能够独立执行编程流程、管理研究项目,并在内部测试中实现从零开始构建操作系统。

此次发布标志着谷歌从将AI定位为对话工具,转向将AI视为具备自主行动能力的工具。它不仅能回答问题,更能在极少人工干预下进行规划、构建和迭代实际工作。

DeepMind首席技术官Koray Kavukcuoglu在公开发布前对媒体表示:“3.5 Flash在质量和低延迟方面表现卓越,几乎在所有基准测试中都优于我们最新的前沿模型3.1 Pro,包括编程、代理任务和多模态推理。”

他补充说,该模型速度是其他前沿模型的4倍,非常适合编程和代理任务;谷歌还开发了优化版本,使其速度提升至12倍,且保持同等质量。

速度是Flash设计用于代理工作的核心,多个AI代理可以同时运行,处理长期任务。谷歌工程师Varun Mohan在I/O大会现场演示了代理如何分工协作,分别处理不同组件,最终在公司代理开发平台和集成开发环境Antigravity中共同构建完整操作系统。

Gemini 3.5性能分析图

Kavukcuoglu表示,Flash 3.5与Antigravity共同开发,为代理提供了“一个原生环境,让它们可以生活、工作和执行任务”。

在I/O大会上,谷歌还发布了Antigravity 2.0,这是一款专为代理优先开发设计的独立桌面应用。

这些进步不仅体现在演示中,谷歌称3.5 Flash的代理能力已在合作伙伴中产生影响,例如银行和金融科技公司自动化多周工作流程,数据科学团队在复杂数据环境中发现洞见。

该模型可以自主运行数小时,但谷歌产品高级总监Tulsee Doshi表示,当遇到需要人类判断的决策点或权限问题时,模型会暂停并请求用户输入。

谷歌即将发布的3.5 Pro模型将与3.5 Flash协同工作。

Doshi告诉TechCrunch:“3.5 Pro将成为你的协调者和规划者,能够利用Flash作为多个子代理。我认为关键在于你希望在哪些环节发挥推理能力,在哪些任务上需要强大的工具执行能力。”

目前,3.5 Flash已成为Gemini应用和全球搜索AI模式的默认模型。谷歌还宣布将在搜索中引入代理功能,允许用户直接在平台上创建、定制和管理AI代理。新模型还将支持Gemini Spark,这是谷歌设计的全天候个人AI代理,帮助用户管理数字生活。

为普通用户提供如此强大的AI能力也带来了审视。去年,一名男子在与Gemini长时间聊天后,几乎实施大规模伤害事件并最终自杀,谷歌因此面临诉讼。

当强大自主代理更广泛可用时,潜在风险也随之增加。谷歌表示,Gemini 3.5加强了网络安全及化学、生物、放射性和核防护措施,并更好地调整了对敏感问题的应对方式,而非简单拒绝。

Gemini 3.5 Flash现已通过Antigravity、Gemini API、Gemini Enterprise,以及Gemini应用和搜索AI模式向公众开放。