Apple PICO

苹果公司发布了一种名为PICO(Perceptual Image Codec)的AI图像压缩编码器,该技术相比AV1和JPEG AI,能够实现2.3到3倍的比特率压缩。

PICO是一款以人类视觉感知质量为核心优化的图像压缩编码器。它采用基于神经网络的学习型图像编码技术,通过模拟人眼视觉系统,确保压缩后图像在视觉上依然“自然且清晰”,有效保留细节。

该技术不仅压缩效率高,处理速度也非常快。与现有的AV1、AV2、VVC、ECM、JPEG-AI等编码器相比,PICO的压缩效率提升了2.3至3倍。在使用日本苹果国家iPhone 17 Pro Max进行编码和解码测试时,针对1200万像素图像,编码时间为230毫秒,解码时间为150毫秒,速度超过了多数运行于NVIDIA V100上的学习型编码器。

在图像质量评估方面,PICO结合了多种指标,包括基于人眼视觉特性的多尺度结构相似性(MS-SSIM)、像素级比较以及针对AI的图像相似度指标LPIPS(Learned Perceptual Image Patch Similarity),全面衡量图像的视觉相似度和质量。

此外,苹果还通过大规模主观测试验证了PICO输出图像的视觉质量。测试采用众包方式,邀请大量人类评审者对比PICO与现有编码器生成的图像,进行二选一的接近原图选择,并通过统计方法对结果进行排名,确保压缩后图像在视觉上获得高度认可。

PICO测试