随着人工智能开始与物理世界互动,新的实验室正致力于构建可用于操作物理机器人或模拟物理空间中物体的世界模型。与大型语言模型不同,这类模型缺乏易得的数据来源,导致许多实验室急于收集所需的训练数据集。
如今,一家初创公司找到了一个意想不到的数据来源:视频游戏行业。
这就是Origin Lab的核心理念。该公司刚刚宣布完成由Lightspeed Ventures领投的800万美元种子轮融资,参与投资的还有SV Angel、Eniac、Seven Stars和FPV,天使投资人包括Twitch联合创始人Kevin Lin和Cruise创始人Kyle Vogt。
“当前构建的AI系统需要理解物理世界的运作方式和物体的运动规律,”联合CEO兼联合创始人Anne-Margot Rodde告诉TechCrunch。“这些数据实际上存在于视频游戏中。”公司其他联合创始人包括Antoine Gargot和Colin Carrier。
简单来说,Origin Lab将作为一个市场平台,让专注于世界模型的实验室(如Yann LeCun的AMI Labs或Fei-Fei Li的World Labs)购买高质量的授权数据。另一方面,视频游戏公司可以从其已创建的数字资产中获得额外收入。Origin Lab则负责将视频游戏资产转换成适合训练的数据形式,这可能是简单的渲染输出,也可能是自动化处理数小时的游戏实况录像。

“显而易见,视频游戏行业掌握着极其宝贵的数据,但缺乏连接AI实验室和游戏行业的有效途径和基础设施,”Rodde说。“所以我们搭建了这座桥梁。”
长期以来,实验室们对视频游戏录像作为数据源非常感兴趣,但授权和数据质量问题常常成为障碍。2024年12月,OpenAI因其首个视频生成模型Sora似乎复现了热门游戏和主播的画面而引发争议,这很可能是因为模型训练时使用了Twitch直播内容。亚马逊也公开表示有兴趣利用Twitch录像来训练模型。
Origin Lab此次融资成功,反映出市场需求的增长——不仅是训练数据市场,还有作为主要AI实验室关键供应商的初创企业市场。Lightspeed合伙人Faraz Fatemi表示,像Scale AI这样的公司的成功让这一机会变得不可忽视。
“我们已经看到为主要实验室提供数据的供应商收入增长的速度非常惊人,”Fatemi告诉TechCrunch。“这些企业资金充足,而它们面临的瓶颈就是数据。”


