随着对AI模型训练和优化需求的不断增长,专注于后期训练数据和评估工作的初创公司Deccan AI完成了首轮2500万美元的融资。该公司大量依靠印度专家团队完成相关工作。

此次全股权的A轮融资由A91 Partners领投,Susquehanna International Group和Prosus Ventures参与。虽然OpenAI和Anthropic等前沿AI实验室自行构建核心模型,但越来越多的后期训练工作——包括数据生成、评估和强化学习——被外包,以确保系统在实际应用中的可靠性。Deccan AI正是满足这一需求的新兴企业之一。

Deccan AI成立于2024年10月,提供从提升模型编码和代理能力,到训练系统与外部工具(如API)交互的多样化服务。公司与前沿实验室合作,承担专家反馈生成、评估执行及强化学习环境搭建等任务,同时通过其评估套件Helix和运营自动化平台为企业客户提供支持。随着模型从文本扩展到更好理解物理环境的“世界模型”,包括机器人和视觉系统,Deccan的服务也在不断演进。

据公司介绍,Deccan的客户包括Google DeepMind和Snowflake。创始人Rukesh Reddy在采访中表示,公司已签约约10家客户,常年运行数十个活跃项目。

总部位于旧金山湾区的Deccan,在印度海得拉巴设有大型运营团队,员工约125人,并依托超过100万名贡献者组成的网络,包括学生、领域专家和博士。Reddy透露,通常每月活跃贡献者在5000至10000人之间。

约10%的贡献者拥有硕士或博士学位,活跃贡献者中高学历比例更高,具体取决于项目需求。

随着大型语言模型的兴起,AI训练服务市场迅速扩大。Meta旗下的Scale AI及其竞争对手Surge AI,以及初创企业Turing和Mercor等,都在提供数据标注、评估和强化学习服务。

Reddy指出,质量仍是未解决的问题,后期训练对错误的容忍度几乎为零,因为错误会直接影响模型在生产环境中的表现。这使得后期训练比早期阶段更复杂,需要高度准确且领域特定的数据,且难以规模化。

此外,工作时间敏感性强,AI实验室有时需要在几天内获得大量高质量数据,速度与准确性的平衡极具挑战。

该行业因工作条件和薪酬问题受到批评,许多零工参与训练数据生成。Reddy表示,Deccan平台上的收入从每小时约10美元到700美元不等,顶尖贡献者月收入可达7000美元。

尽管Deccan的客户主要是美国的AI实验室,但其大部分贡献者位于印度。竞争对手如Turing和Mercor也从印度招募承包商,但业务覆盖更多新兴市场。

Reddy表示,Deccan选择集中印度团队以更好地控制质量。“许多竞争对手在100多个国家寻找专家,而只在一个国家运营更易于保持质量。”

这反映出印度在全球AI价值链中的地位——作为人才和训练数据供应者,而非前沿模型的开发者,后者主要集中在少数美国和中国公司手中。

不过,Deccan也开始从美国等其他市场招募具备地理空间数据和半导体设计等专业技能的人才。

Reddy称,Deccan是一家“天生的生成式AI公司”,与传统从计算机视觉任务起步的数据标注公司不同,公司从一开始就专注于高技能工作。

过去一年,Deccan实现了10倍增长,目前年收入达到数千万美元的规模。约80%的收入来自前五大客户,反映出前沿AI市场的集中度。