
美国Google公司于4月21日(当地时间)宣布推出基于「Gemini 3.1 Pro」的新型智能调研工具——「Deep Research」和「Deep Research Max」。这两款产品已通过「Gemini API」的付费计划开始公开预览。
「Gemini Deep Research」是一款能够自主规划和执行调研任务,并汇总结果的智能代理,包含以下两种变体:
- Deep Research:注重速度和效率,低延迟特性适合集成到与用户互动的界面中。
- Deep Research Max:强调全面性和质量,支持长时间推理,适合在非同步的后台工作流程中生成详细报告,例如下班到次日上班期间。
新版本的「Gemini Deep Research」具备多项先进功能:
- MCP(模型上下文协议)支持:能够安全连接金融和市场数据等专有数据源。
- 图表及信息图生成:不仅支持文本,还能将高质量视觉内容纳入报告,利用HTML技术和图像生成模型「Nano Banana 2」。
- 协同规划:调研开始时,代理会生成调研计划,用户可进行确认和修改,灵活指定调研范围和深度。
- 扩展工具支持:通过「Gemini API」支持的Google搜索、远程MCP服务器、URL上下文、代码执行及文件搜索,实现更深入的调研。也可完全关闭网络访问,仅使用自定义数据进行调研。
- 多模态支持:可输入PDF文档、CSV数据、图片、音频和视频文件,供代理使用。
- 实时流式推理:用户可逐步查看代理的推理过程,便于构建交互式界面。

特别是「Deep Research Max」自去年12月发布以来性能大幅提升,能够捕捉之前版本容易忽略的重要细节。该技术已被应用于Google自家的「Gemini」应用、「NotebookLM」和Google搜索等产品基础设施,预计将显著提升这些服务的质量。



