2024年3月18日,苹果再次成为版权侵权诉讼的被告之一。原告Chicken Soup for the Soul, LLC指控苹果使用包含盗版书籍的“The Pile”数据集进行人工智能训练。此次大规模诉讼还涉及Meta、xAI、谷歌、Anthropic、OpenAI、Perplexity和NVIDIA等全球科技巨头。案件的核心争议点在于数据集中的“Books3”影子图书馆模块,该模块包含大量受版权保护的文学作品。

针对指控,苹果重申自2024年以来一直致力于以合法合规的方式构建AI数据集。虽然苹果研究人员曾在开源项目OpenELMs中使用过“The Pile”数据集,但公司强调该项目仅用于公开研究,未用于驱动苹果核心智能系统。然而,法律分析人士指出,由于苹果的基础模型得到了谷歌Gemini的技术支持,如果谷歌在本案中被认定违规,苹果可能因技术供应链关系面临复杂的连带责任。

目前,Perplexity等公司为其网页抓取行为进行辩护,苹果则坚持其模型训练的透明性和合规性。随着AI监管趋严,这场针对底层训练数据的集体诉讼不仅标志着创作者对科技巨头“数据剥削”的抵抗升级,也将迫使整个行业重新审视模型训练中“数据可追溯性”的合规成本和技术边界。