近日,大英百科全书(Encyclopedia Britannica)及其子公司梅里亚姆-韦伯斯特(Merriam-Webster)对OpenAI提起诉讼,指控其未经许可大规模使用百科全书和词典的版权内容来训练其GPT系列人工智能模型。去年,大英百科全书曾对Perplexity.AI提起类似诉讼。

根据诉状,大英百科全书称OpenAI非法复制了近10万篇在线文章、百科条目和词典定义,甚至ChatGPT会生成与原文几乎一模一样的内容。更严重的是,OpenAI通过向ChatGPT用户展示其内容的AI生成摘要,侵蚀了大英百科全书的网络流量,影响了其收益。

这一诉求与新闻媒体和其他在线平台的担忧相呼应,他们发现随着越来越多用户使用AI聊天机器人而非传统搜索引擎,网站流量和收入受到挤压。大英百科全书在诉状中指出,ChatGPT通过生成用户查询的回答,直接替代并与其内容竞争,导致其收入减少。

此外,大英百科全书援引美国《兰哈姆法案》(Lanham Act),指控OpenAI在ChatGPT产生虚假答案并错误引用百科内容时,侵犯了其商标权,误导用户认为这些内容得到了百科全书的授权或支持。

这起诉讼是众多针对AI公司的版权诉讼之一,涉及作者、出版商和新闻机构。案件结果可能对生成式AI公司的运营模式产生深远影响。目前,是否构成侵权仍存在争议,尤其是AI开发者往往不公开其训练数据来源。

此前,一起较为重要的案件是作者对Anthropic的诉讼。Anthropic被发现盗用数百万数字书籍及扫描大量实体书籍训练其Claude聊天机器人。法院判定其训练行为具有“变革性”,但盗版行为违法,最终Anthropic同意支付15亿美元和解。

这场诉讼再次引发业界对AI训练数据合法性和版权保护的关注,未来相关法律判决将对AI技术发展方向产生关键影响。