Google Chrome AI功能扩展

近日,在日本Google举办的「Google I/O 2026」大会上,Google宣布了多项基于AI的新功能和改进,浏览器产品「Google Chrome」也不例外,特别是其内置的AI功能得到了显著扩展。

“Prompt API”在Chrome 148版本中正式进入稳定版阶段

首先,Google宣布其轻量级AI模型“Gemini Nano”驱动的“Prompt API”在「Chrome 148」版本中成为稳定版。该API允许Web应用和扩展程序在本地处理自然语言请求。虽然功能不及大型模型强大,但由于不依赖云服务,用户即使在无网络环境下也能使用,同时数据不会传输到设备外部,极大保障了隐私安全。输入支持多模态(文本、语音、视频等),输出则可通过JSON结构化格式呈现。

Prompt API示意图

此外,基于本地模型的API还包括:

  • Summarizer API:文本摘要
  • Writer API:文本生成
  • Rewriter API:文本润色
  • Proofreader API:语法、拼写及标点校对
  • Language Detector API:语言检测(仅限PC版)
  • Translator API:文本翻译(仅限PC版)

需要注意的是,部分API在移动端不支持。

对于PC端运行的“Prompt API”、“Summarizer API”、“Writer API”、“Rewriter API”、“Proofreader API”,系统要求较高:

  • 操作系统:Windows 10/11、macOS 13 Ventura及以上、Linux、Chromebook Plus设备的ChromeOS(版本16389.0.0及以上)
  • 存储空间:Chrome配置文件所在分区需有至少22GB空闲空间
  • 硬件配置:16GB及以上内存,4核及以上CPU,配备4GB以上显存的GPU(使用语音输入的Prompt API必需)
  • 网络:需有不限流量或非计费连接(模型本地运行,但首次下载需要网络)

超高效专家模型“Gemma 197M”发布

Google还推出了参数量为197M的超高效专家模型“Gemma 197M”,该模型可在后台增强如文本摘要等任务的性能,并根据设备性能自动调整负载和表现,适配从低端到高端的各种设备。

这些模型由Chrome端进行设备优化管理,并在考虑安全性的前提下实现跨网站共享,Web开发者无需自行管理模型,只需调用API即可轻松将本地AI功能集成到自己的网站中。

Gemma 197M模型示意

想要体验这些API的用户,可以访问由微软Edge团队提供的“Prompt API playground”,轻松试用上述功能。

Prompt API playground界面