在本周的谷歌I/O开发者大会上,我们有机会短暂体验了谷歌即将推出的AI智能眼镜——这不是公司计划今年秋季发货的纯音频眼镜,而是结合了音频和视觉体验的智能眼镜。

这款Android XR眼镜首次在去年的大会上发布,配备了镜片内显示屏,可以将有用的信息叠加在现实世界之上。它支持显示天气、步行导航、Uber接车信息、实时翻译等小工具,甚至可以通过AI自定义设计小工具。

谷歌表示,这款眼镜将兼容iOS和Android手机,支持纯音频和未来的显示版本。

带显示屏的眼镜是继今年晚些时候发布的第一代音频眼镜之后的下一步产品。该眼镜由谷歌与Warby Parker、Gentle Monster和三星合作开发,融合了谷歌的技术和合作品牌的设计美学。

我们试用的眼镜仍是原型机,虽然已经足够精细,可以进行外部测试。演示人员表示,原型机让谷歌无需过多关注不同款式和形状的外观细节,能够更自由地实验显示技术及其对电池寿命的影响。因此,这款眼镜在贴合度、形状、尺寸和细节处理上与未来量产版本有很大不同,更像是在基础舒适框架内对“内部”技术的实验。

量产版眼镜将能检测佩戴和摘下状态,但我们试用的原型机没有此功能。

激活AI助手Gemini,需要在眼镜右侧框架按压两秒,启动音响起,表示Gemini已开启并开始监听。演示版启动Gemini时会同时开启摄像头,但量产版用户可自行选择是否启动摄像头。

初步测试中,我们通过眼镜让Gemini播放喜欢的音乐。由于现场噪音较大,音质难以准确评估,音量调至最大仍不够清晰。总体感觉,这款眼镜无法替代高品质耳机,但适合户外散步、徒步或做家务时听音乐。相比苹果AirPods的通透模式,不戴耳塞更容易听见周围人声。

关闭音乐只需轻触框架侧面中部一次,类似轻拍太阳穴。

第二次测试中,我们按下拍照键为一位人物拍照。显示屏关闭,照片传输至手机和手表。未来长按可录制视频,视频会显示缩略图预览,原型机暂未支持此功能。

你也可以直接让Gemini拍照并进行AI处理,比如说“拍张照片,把人物变成动漫角色”。照片会传至手机,再上传至Gemini和Nano Banana服务器,最后返回编辑后的版本。

在谷歌I/O现场,因Wi-Fi负载较重,整个过程约耗时45秒。

开启显示屏后,视野中会出现简洁的主屏幕。演示版预装了显示天气和谷歌I/O倒计时的小工具。用户还可快速启动谷歌地图或翻译等应用,方便日常使用。

原型机仅在右眼配备一块显示屏,但平台支持单屏、双屏及纯音频眼镜。显示画面略显模糊,我们推测是因为佩戴了不同焦距的隐形眼镜。闭上一只眼后画面更清晰,但右眼上方很快感到眼睛疲劳,是否完全因处方眼镜尚不确定。

最令人印象深刻的是眼镜的语言翻译功能,依托手机上的谷歌翻译应用。演示者快速讲西班牙语,眼镜自动识别语言并在显示屏上显示英文文本,同时Gemini通过耳机播放英文翻译。这个功能对旅行者极具吸引力。

需要说明的是,纯音频眼镜也支持翻译功能,只是没有文字显示,转录内容可在手机上查看,并提供实时语音反馈。

另一演示是导航功能。虽然无法离开会场实地测试,但我们体验了其工作方式。只需让Gemini导航至目的地,比如“最近的咖啡店”,它会启动手机上的谷歌地图,眼镜显示逐步导航信息。直视前方时显示下一步转弯提示,低头看地面则显示蓝点地图,左右转头可调整方向,抬头后地图自动隐藏,方便继续前行。

导航体验与手机谷歌地图同步,预设的“家”和“工作”等地点也可直接使用。

我们还用眼镜识别视野中的物体并提问。起初眼镜未能识别架上的莫奈复制画,因为摄像头未自动开启,需要从应用手动启动。经过几次提问后,Gemini确认那是莫奈作品,甚至能识别画作左下角的签名。

其他测试更顺利,眼镜迅速识别了架上的植物,并回答了关于书中食谱的问题。虽然这些功能目前通过谷歌镜头或集成AI的聊天机器人应用也能实现,但眼镜让你无需掏出手机即可完成。

谷歌表示,今年晚些时候将扩大可信测试者计划,届时会公布更多关于Android XR显示眼镜的信息。

目前公司认为,音频眼镜已能满足部分用户需求,这或许是对尚未准备好显示眼镜的现实的巧妙回应,毕竟Meta和Snap在这方面竞争激烈。

与显示版类似,音频眼镜也能访问谷歌的Gemini AI,通过眼镜框架内置扬声器私密听取。用户可以听音乐、按键拍照、拨打电话,或调用手机应用。

虽然我们未演示第三方应用的接入,但眼镜支持用户让Gemini执行诸如“把这道菜的食材加入购物清单”等操作。

谷歌在大会主题演讲中展示了另一场景:眼镜能观察用户在炉灶上烹饪的食物,并提供反馈,比如肉是否已熟透。