AI行业通常对版权法采取忽视态度,除非涉及自身利益。根据《华尔街日报》报道,Anthropic正紧急应对其Claude AI模型源代码泄露事件,向GitHub提交了超过8000份版权删除请求,试图控制泄露范围。这一举动对于一家曾因训练数据来源问题备受争议的公司来说,显得颇具讽刺意味。

Anthropic表示,此次泄露并未涉及客户数据,也未暴露AI模型的核心数学“权重”,但泄露了其工程师用来让AI模型作为自主代理运行的关键技术和数字基础设施代码。随后,Anthropic将版权删除请求的目标从8000份缩减至96份,称最初的请求覆盖了过多账户。

虽然Anthropic有权保护其知识产权,但其此前依赖未经授权的盗版书籍训练AI模型的事实,使得其此次维权行为显得颇为矛盾。早期,Anthropic从在线“影子图书馆”LibGen下载了数百万盗版电子书,甚至还使用了名为“Pirate Library Mirror”的盗版书库。Anthropic联合创始人Ben Mann曾对该网站上线表示兴奋。

这些行为引发了作者团体的诉讼,最终Anthropic以15亿美元和解。除此之外,Anthropic还秘密开展了“巴拿马计划”,扫描并销毁了数百万册二手实体书籍,尽管法官未认定该行为违法,但公司内部文件显示他们对该行为的公开形象极为谨慎。

此次源代码泄露的直接原因是Anthropic在发布Claude Code 2.1.88版本的npm包时,意外包含了指向源代码位置的“源映射文件”,为外界提供了“藏宝图”。黑客顺藤摸瓜下载了代码并上传至GitHub,至今仍可找到相关副本。此次事件也引发了外界对是否有AI参与泄露的猜测,毕竟包括亚马逊和Meta在内的多家竞争对手都曾发生过AI编码失误。Anthropic官方则坚称这是“人为错误”。

更多AI资讯: 泄露的Claude代码显示Anthropic正在构建神秘的“电子宠物”功能