AI助手正从“只会聊天”迈向“帮你做事”。
近日,谷歌正式在Pixel 10 Pro和Galaxy S26 Ultra上推出了Gemini任务自动化功能。这标志着AI助手从“对话工具”向“执行代理(Agent)”的正式进化,不仅能回答问题,还能接管手机屏幕为你处理各种任务。
测试体验:真正的“无人驾驶”,但需要耐心
根据开源中国披露的测试案例,如果你想通过DoorDash点外卖,只需用自然语言向Gemini下达指令,后续操作堪称“科幻”:
- 背景操作:AI会自动打开应用,识别界面元素,填写表单,选择选项并确认订单。
- 异步执行:执行过程中,屏幕底部会实时滚动显示“选择目的地”等信息。最酷的是,你可以切换去看视频或回复邮件,AI会在后台持续运行直到任务完成。
- 速度瓶颈:目前的缺点是“慢”。由于AI需要逐帧识别界面并进行云端推理,手动2分钟完成的任务,AI可能需要9分钟。
技术突破:打破十年“信息查询”天花板
过去十年,从Siri到谷歌助手,语音助手一直停留在设闹钟、查天气的浅层次。Gemini任务自动化的核心突破在于它能规划复杂的长链任务,实现“下命令-等待结果”的闭环。
![]()
生态限制:仍处于“概念产品”阶段
尽管前景广阔,当前自动化功能仍面临诸多挑战:
- 适配范围狭窄:目前仅支持Uber、DoorDash等高度标准化的应用。
- 容错能力需提升:界面识别错误或支付环节的安全限制依然是普及的主要障碍。
巨头角逐:2026年将是“AI代理”元年
随着OpenAI的Operator和苹果的Apple Intelligence相继发力,谷歌率先切入移动市场,试图借助Android生态抢占日常生活高频场景。
虽然现阶段Gemini任务自动化略显“笨拙”,但技术进步往往呈指数曲线发展。当AI能以人类速度流畅操作任何应用时,我们与手机的交互方式将被彻底重塑。这一“慢但酷”的演进,是迈向通用人工智能(AGI)的关键一步。


