谷歌推出Gemini 3.5 Flash，押注AI智能代理而非聊天机器人

谷歌于周二发布了Gemini 3.5 Flash，这是一款公司迄今为止最强大的AI模型，专注于编程和自主AI代理。该模型在谷歌年度开发者大会Google I/O上亮相，能够独立执行编程流程、管理研究项目，并在内部测试中实现从零开始构建操作系统。

此次发布标志着谷歌从将AI定位为对话工具，转向将AI视为具备自主行动能力的工具。它不仅能回答问题，更能在极少人工干预下进行规划、构建和迭代实际工作。

DeepMind首席技术官Koray Kavukcuoglu在公开发布前对媒体表示：“3.5 Flash在质量和低延迟方面表现卓越，几乎在所有基准测试中都优于我们最新的前沿模型3.1 Pro，包括编程、代理任务和多模态推理。”

他补充说，该模型速度是其他前沿模型的4倍，非常适合编程和代理任务；谷歌还开发了优化版本，使其速度提升至12倍，且保持同等质量。

速度是Flash设计用于代理工作的核心，多个AI代理可以同时运行，处理长期任务。谷歌工程师Varun Mohan在I/O大会现场演示了代理如何分工协作，分别处理不同组件，最终在公司代理开发平台和集成开发环境Antigravity中共同构建完整操作系统。

Gemini 3.5性能分析图

Kavukcuoglu表示，Flash 3.5与Antigravity共同开发，为代理提供了“一个原生环境，让它们可以生活、工作和执行任务”。

在I/O大会上，谷歌还发布了Antigravity 2.0，这是一款专为代理优先开发设计的独立桌面应用。

这些进步不仅体现在演示中，谷歌称3.5 Flash的代理能力已在合作伙伴中产生影响，例如银行和金融科技公司自动化多周工作流程，数据科学团队在复杂数据环境中发现洞见。

该模型可以自主运行数小时，但谷歌产品高级总监Tulsee Doshi表示，当遇到需要人类判断的决策点或权限问题时，模型会暂停并请求用户输入。

谷歌即将发布的3.5 Pro模型将与3.5 Flash协同工作。

Doshi告诉TechCrunch：“3.5 Pro将成为你的协调者和规划者，能够利用Flash作为多个子代理。我认为关键在于你希望在哪些环节发挥推理能力，在哪些任务上需要强大的工具执行能力。”

目前，3.5 Flash已成为Gemini应用和全球搜索AI模式的默认模型。谷歌还宣布将在搜索中引入代理功能，允许用户直接在平台上创建、定制和管理AI代理。新模型还将支持Gemini Spark，这是谷歌设计的全天候个人AI代理，帮助用户管理数字生活。

为普通用户提供如此强大的AI能力也带来了审视。去年，一名男子在与Gemini长时间聊天后，几乎实施大规模伤害事件并最终自杀，谷歌因此面临诉讼。

当强大自主代理更广泛可用时，潜在风险也随之增加。谷歌表示，Gemini 3.5加强了网络安全及化学、生物、放射性和核防护措施，并更好地调整了对敏感问题的应对方式，而非简单拒绝。

Gemini 3.5 Flash现已通过Antigravity、Gemini API、Gemini Enterprise，以及Gemini应用和搜索AI模式向公众开放。

评论