随着人工智能领域版权争议的不断升级,传统知识权威机构也开始采取法律行动。近日,全球知名的大英百科全书及其子公司韦氏词典正式向法院提起诉讼,指控OpenAI未经授权大量使用其受版权保护的内容,用于训练AI模型。

这起诉讼紧随去年两家机构对AI搜索公司Perplexity提起的诉讼之后。诉状中,大英百科全书称OpenAI非法复制了近十万篇在线文章、百科条目和词典定义,用以训练其GPT系列大型模型。

"流量掠夺"与几乎逐字抄袭

原告在诉讼中列举了多个实例,指出ChatGPT在回答用户问题时生成的内容与大英百科全书的内容几乎一模一样。更令出版方担忧的是,AI生成的内容摘要直接在聊天界面回应用户问题,导致原本属于百科网站的流量被严重“掏空”,直接损害了其依赖流量的收入模式。

伪造出处:兰哈姆法案下的新指控

除了版权侵权外,诉讼还援引了兰哈姆法案中的商标条款。原告称,ChatGPT有时会出现“幻觉”现象,捏造事实并错误地声称这些信息来自大英百科全书。这种误导行为不仅损害了百科全书的权威声誉,还使公众误以为其内容的使用已获得官方授权或认可。

法律风暴中的AI行业未来

目前,OpenAI、Anthropic等AI巨头正面临来自作者、出版商和新闻机构的一系列诉讼。虽然部分法官曾认为AI训练具有“变革性”特征,但使用盗版材料仍被视为违法。例如,Anthropic曾因使用盗版电子书训练模型支付了15亿美元的和解金。

随着传统知识权威机构纷纷采取法律行动,长期拒绝公开训练数据来源的生成式AI公司“黑箱”操作正面临前所未有的挑战。这场诉讼的结果将直接决定未来AI产业与传统版权持有者之间的权力边界。