AI训练数据所有权争议升级：苹果深陷开源项目版权侵权指控

2024年3月18日，苹果再次成为版权侵权诉讼的被告之一。原告Chicken Soup for the Soul, LLC指控苹果使用包含盗版书籍的“The Pile”数据集进行人工智能训练。此次大规模诉讼还涉及Meta、xAI、谷歌、Anthropic、OpenAI、Perplexity和NVIDIA等全球科技巨头。案件的核心争议点在于数据集中的“Books3”影子图书馆模块，该模块包含大量受版权保护的文学作品。

针对指控，苹果重申自2024年以来一直致力于以合法合规的方式构建AI数据集。虽然苹果研究人员曾在开源项目OpenELMs中使用过“The Pile”数据集，但公司强调该项目仅用于公开研究，未用于驱动苹果核心智能系统。然而，法律分析人士指出，由于苹果的基础模型得到了谷歌Gemini的技术支持，如果谷歌在本案中被认定违规，苹果可能因技术供应链关系面临复杂的连带责任。

目前，Perplexity等公司为其网页抓取行为进行辩护，苹果则坚持其模型训练的透明性和合规性。随着AI监管趋严，这场针对底层训练数据的集体诉讼不仅标志着创作者对科技巨头“数据剥削”的抵抗升级，也将迫使整个行业重新审视模型训练中“数据可追溯性”的合规成本和技术边界。

AI训练数据所有权争议升级：苹果深陷开源项目版权侵权指控

标签

评论

相关阅读

Medicare新支付模式为AI量身打造，科技界大多尚未察觉

AI短片引发愤怒：将1970年代女性制作成情色影像引争议

1X Neo机器人拥有惊人的快速灵巧手指