大英百科全书对OpenAI提起震撼诉讼

近日，大英百科全书（Encyclopedia Britannica）及其子公司梅里亚姆-韦伯斯特（Merriam-Webster）对OpenAI提起诉讼，指控其未经许可大规模使用百科全书和词典的版权内容来训练其GPT系列人工智能模型。去年，大英百科全书曾对Perplexity.AI提起类似诉讼。

根据诉状，大英百科全书称OpenAI非法复制了近10万篇在线文章、百科条目和词典定义，甚至ChatGPT会生成与原文几乎一模一样的内容。更严重的是，OpenAI通过向ChatGPT用户展示其内容的AI生成摘要，侵蚀了大英百科全书的网络流量，影响了其收益。

这一诉求与新闻媒体和其他在线平台的担忧相呼应，他们发现随着越来越多用户使用AI聊天机器人而非传统搜索引擎，网站流量和收入受到挤压。大英百科全书在诉状中指出，ChatGPT通过生成用户查询的回答，直接替代并与其内容竞争，导致其收入减少。

此外，大英百科全书援引美国《兰哈姆法案》（Lanham Act），指控OpenAI在ChatGPT产生虚假答案并错误引用百科内容时，侵犯了其商标权，误导用户认为这些内容得到了百科全书的授权或支持。

这起诉讼是众多针对AI公司的版权诉讼之一，涉及作者、出版商和新闻机构。案件结果可能对生成式AI公司的运营模式产生深远影响。目前，是否构成侵权仍存在争议，尤其是AI开发者往往不公开其训练数据来源。

此前，一起较为重要的案件是作者对Anthropic的诉讼。Anthropic被发现盗用数百万数字书籍及扫描大量实体书籍训练其Claude聊天机器人。法院判定其训练行为具有“变革性”，但盗版行为违法，最终Anthropic同意支付15亿美元和解。

这场诉讼再次引发业界对AI训练数据合法性和版权保护的关注，未来相关法律判决将对AI技术发展方向产生关键影响。

评论