AI助手的终极进化：Gemini任务自动化上线，智能手机开始为你执行操作

发布时间：2026/3/19

谷歌期待已久的人工智能愿景终于成为现实。今天，谷歌联合宣布基于Gemini的“任务自动化”功能已进入Beta测试阶段。该功能标志着AI助手从单纯的“信息搜索者”转变为能够跨应用执行任务的“数字助理”，能够模拟人类操作完成订餐、叫车等复杂流程。

视觉冲击：看手机“自己操作”

与传统的API集成不同，谷歌的自动化功能在一个虚拟窗口内模拟真实用户操作：

智能叫车：当用户发出“叫一辆去机场的出租车”指令时，系统会自动打开Uber，确认具体航站楼（如果有多个航站楼，会主动询问），并自动填写目的地。
订餐服务：当用户说“帮我点一杯咖啡和一个羊角面包”时，AI会自主滚动屏幕，查找星巴克菜单中的具体商品（如Flat White），甚至能像人类一样处理复杂的滚动选择。

安全机制：关键环节由人掌控

为避免自动化带来的风险，谷歌在自动化流程中引入了严格的人工审核机制：

明确操作：用户可以实时观看AI的每一步操作，随时接管或终止自动化流程。
最终确认：在提交订单或付款前，系统会停留在支付界面，等待用户核对信息并手动点击“确认”，确保每笔交易都在可控条件下完成。

目前，该功能优先支持外卖和叫车应用。对于使用Gemini及后续版本的用户来说，手机不再只是运行应用的载体，而是能够理解自然语言意图并将其转化为具体操作的“超级代理”。

尽管AI在滚动菜单和识别选项时偶尔显得有些“笨拙”，这种无需深度API适配、直接通过UI交互实现的自动化模式极大拓展了AI助手的应用边界。随着算法的不断迭代，我们正逐步告别频繁切换应用的时代，迈入只需一句话即可完成所有小任务的真正智能阶段。

标签

#人工智能 #任务自动化 #数字助理 #智能手机 #用户体验

评论

评论系统可后续接入后端接口，这里先保留展示与提交区域。

相关阅读

日本PIXTA终止AI生成素材销售，但不否定AI技术应用

2026/05/28

日本PIXTA终止AI生成素材销售，但不否定AI技术应用

由日本PIXTA运营的照片、插画、视频及音乐素材市场平台“PIXTA”于5月22日正式停止销售“AI生成素材”。早在4月20日，PIXTA便已停止接受新的AI生成内容申请，此次则是终止了此前作为“AI生成素材”进行销售的作品。不过，考虑到AI技术在当今创意领域的广泛应用，公司表示将允许创作者在不大幅修改其亲自拍摄或创作作品的前提下，辅助性地使用AI技术。此前，PIXTA尊重AI作为新表达手法

软银与美国MODE达成资本及业务合作，利用生成式AI与物联网提升建筑及制造现场决策水平

2026/05/02

软银与美国MODE达成资本及业务合作，利用生成式AI与物联网提升建筑及制造现场决策水平

日本软银株式会社与美国MODE公司于28日宣布，双方将通过生成式人工智能（AI）与物联网（IoT）技术的结合，推动建筑和制造现场基于数据的高级决策实现。此次合作旨在整合MODE在现场数据整合与结构化方面的技术优势，与软银在生成式AI、云服务、通信网络及企业客户基础的资源，促进现场业务中数据应用的推广与深化。 MODE公司提供的解决方案型物联网平台“BizStack（ビズスタック）”能够实现现场数据

航空工程一项基本原理被颠覆

2026/05/28

航空工程一项基本原理被颠覆

当飞机或汽车高速行驶时，其表面会形成一层称为边界层的薄空气层。边界层有两种状态：层流，即空气有序流动；以及湍流，即空气流动混乱。空气保持在低摩擦的层流状态的时间越长，空气阻力越小，但随着速度增加，空气会转变为湍流。减少空气动力阻力的关键在于延迟这种向湍流的转变。 80多年来，航空工程的基本原则之一是物体表面必须保持光滑，以减少空气阻力。这一观点源于1940年日本科学家谷一郎的研究，他证明了表面粗