随着科技巨头将生成式人工智能功能融入手机及其摄像软件,真实图像与虚假图像之间的界限变得越来越模糊。例如,谷歌和三星的手机现已具备强大功能,能够通过擦除人物、移动画面中的人物,甚至向场景中添加新物体来大幅修改照片。
苹果也加入了这一潮流,在其照片应用中引入了新的生成式功能。不过,苹果iPhone摄像头负责人Jon McCormack强调,苹果采取的是更为谨慎的策略,不会“为了AI而AI”。
在周一举行的年度全球开发者大会(WWDC)上,苹果展示了即将在今年晚些时候随iOS 27推送到iPhone的多项AI功能,这些功能将深度融入照片应用。
目前,iPhone的照片应用已有“清理”工具,能擦除照片中不需要的物体。iOS 27中,该工具将借助苹果改进的AI模型表现得更出色。此外,还有两个新功能——“扩展”和“空间重构”,它们可以扩展照片周围的空间或改变图像的视角,同时生成虚拟像素。摄像头“思考”应当出现什么内容,然后将其绘制出来。
McCormack表示,AI正帮助解决大量过去难以解决的问题,这些新功能设计非常有针对性。“你不必掌握Photoshop等复杂软件的所有细节——它赋予普通人绝对的超能力。”
不过,苹果并不希望用户随意篡改图像制造各种假象。(至少在照片应用中如此;App Store中有许多制作逼真图像的工具。)照片应用生成的虚拟像素仅限于背景部分,不会更改主体面部的像素。例如,使用“清理”功能时,不能移除照片中的主要主体。“扩展”功能只能使用一次,最多将图像扩展25%,不能保存后再次编辑或无限扩展。
McCormack还透露,苹果将在今年晚些时候整合谷歌DeepMind的SynthID技术,为生成式AI修改的图像添加不可见水印。这样,分享平台可能会标记这些照片为AI编辑。(不过研究显示数字水印并非万无一失。)
“照片记录的是真实发生的事情,”McCormack说,“我们非常重视真实记录生活的理念——拍摄照片就是在捕捉记忆,把生活中的瞬间封存起来,方便日后回顾。我们致力于打造保护这一神圣时刻的工具。”
谷歌Pixel摄像头负责人几年前也表达过类似观点,但他更强调记忆中照片的主观感受。谷歌允许用户更自由地修改图像以符合记忆中的样子,比如让天空更蓝。
而苹果的新工具则更为严格,主要用于解决拍摄过程中未察觉的构图问题。比如背景中有碍眼的塑料袋,或者拍摄孩子时角度稍高,或者配偶靠近画面边缘需要更多空间。
苹果摄像头和照片软件产品经理Della Huff表示,团队花费大量时间训练AI模型,尽量减少数字调整时的“幻觉”现象。“它不会创造不该出现的东西,”Huff说。举例来说,扩展街景时,虽然可能在原图边界外有停放的汽车,但“扩展”不会随意生成汽车。“模型训练的原则是,如果不需要创造,就尽量减少幻觉,只做用户请求的最小调整。”

不过,在我使用iOS 27开发者测试版的“扩展”功能时,拍摄一位朋友坐在桌旁的照片,向右扩展场景时,背景中本有几张桌子,照片应用却额外添加了几张桌子和虚拟人物——这些人现实中并不存在。
Huff解释说,这个功能试图匹配已有的画面风格。如果背景有人物,但扩展时不添加新人物,画面可能显得不自然。“如果规定绝不生成背景人物,功能的实用性会大打折扣。”
值得注意的是,苹果在发布会上强调,这些新摄像功能有使用限制。具体每日限制未公开,但用户若想多次使用“扩展”、“空间重构”或“清理”,需要订阅iCloud。
今年WWDC的一个重要主题是通过自然语言完成操作。用户可以用自然对话与Siri交流,无需死板命令,Siri能理解意图。在日历应用中,描述事件即可快速创建,无需填写繁琐字段。快捷指令应用中,用户可用语言描述想要的快捷方式,无需手动设置触发条件和动作。Safari中甚至可以通过语音安装扩展。那么,为什么不能用自然语言编辑照片呢?谷歌去年就在Google Photos中推出了这项功能。
Huff表示,新的Siri AI可以帮忙做一些简单修饰,苹果也不排除未来会加入更多功能。但目前Siri不能使用新的AI编辑功能,这些功能必须由用户手动操作,因为苹果认为用语音指导改变照片视角等操作体验不好。“这类功能更依赖用户表达意图,尤其是‘空间重构’这类需要明确用户意图的功能。”
谈及Siri,iOS 27的另一大变化是Siri将整合进相机应用。McCormack说,将Siri引入iPhone相机是为了减少操作阻力。
Siri的视觉智能功能类似谷歌Lens,利用计算机视觉分析图像,目前通过相机控制按钮激活。既然这是相机专属功能,放在相机应用中更合理。
“相机不仅是拍摄设备,”他说,“它是记录回忆的工具,是记笔记的工具,或者满足好奇心,比如识别植物。”
苹果的谨慎策略与其图像生成应用Image Playground形成对比。该应用允许用户通过文本提示或导入照片生成AI图像。iOS 27中,Image Playground默认生成更逼真的图片,除非用户指定特定艺术风格。McCormack表示,AI的不同用途会因所在应用环境而异。在照片应用中,用户希望照片记忆真实无虞;而在Playground中,名字就表明这是一个“玩乐”的地方。
“这两种用法都完全合理,”Huff说,“我想改善照片,照片是我用相机捕捉的真实瞬间,照片应用是我改进它的地方。但我也想发挥创造力,让想象力自由驰骋,所以这两种体验是有意区分开的。”


