科技创业公司生态链中出现了一个新环节。创始人们发现,他们可以通过出售已倒闭公司的数字遗产——员工的Slack消息和电子邮件——来赚取额外收入。现在,已经形成了一个专门帮助实现这一交易的生态系统,Forbes有相关报道。

获取高质量的训练数据是构建AI模型的一半难题,而在AI技术迅速发展的今天,新的数据来源越来越难找。来自数字化工作场所如Slack的数据尤其珍贵,因为该行业高度关注构建能够执行工作任务的AI代理,这让AI研究人员能够创建一个真实的沙盒环境供代理学习。

“模型公司意识到,真实环境中的噪声对于准确测试模型至关重要,”微型公司micro1的Ali Ansari说,该公司出售模拟控股公司环境供AI代理学习。

这些模拟的工作场所沙盒被称为强化学习健身房(reinforcement learning gyms,简称RL gyms),其开发已成为一个新兴产业。据The Information报道,Anthropic今年计划在RL gyms上投入10亿美元,多个RL gym创业公司如Prime Intellect和Fleet的估值也接近这一数字。

倒闭创业公司的创始人乐于与RL gym开发者合作,促成这些交易的中介机构也应运而生。SimpleClosure自称是“关闭公司的TurboTax”,最近推出了名为Asset Hub的新工具,允许濒临倒闭的公司出售其Slack档案、邮件和代码库,并在出售前对数据进行匿名处理。其CEO Dori Yona告诉Forbes,过去一年已处理近100笔倒闭公司交易,为创始人回收超过100万美元。

当然,这一现象背后存在不可忽视的矛盾。如果想训练AI在商业中取得成功,基于一家已经倒闭公司的运营数据是否是最佳准备?

涉及数据时,隐私和伦理风险尤为明显。如果雇主录音员工在实体工作场所的所有对话并出售牟利,这无疑是令人愤慨的;但当这些对话发生在数字平台上,出售这些数据却被视为聪明的商业行为,有助于推动下一代AI的发展。

“我认为这里的隐私问题非常严重,”人工智能与数字政策中心创始人Marc Roteberg对Forbes表示,“员工隐私依然是关键问题,尤其是人们对Slack等内部消息工具的依赖日益加深。”

“这不是泛泛的数据,”Roteberg补充,“涉及的是可识别的个人。”

专家们也质疑这些公司声称对出售数据进行了匿名处理的说法。

Protege公司CEO Bobby Samuels表示,该公司负责审核并向AI开发者出售数据,他告诉Forbes:“如果匿名处理不当,拥有数据的公司可能会看到个别组织和个人的活动,若处理不慎,信息可能泄露到模型输出中。”

更多AI资讯: 摩根大通数据中心获7700万美元补贴,却仅创造一个工作岗位