近年来,印度的在线食品配送市场迅速发展,Zomato和Swiggy相继上市,云厨房数量也在增加。与此同时,专注于家政服务的初创企业如Urban Company、Snabbit和Pronto等按需家政平台也逐渐受到关注。

总部位于硅谷的初创公司Human Archive正抓住这一趋势,与这些企业合作,让工作人员佩戴带摄像头的特殊帽子,收集第一人称视角的日常工作视频数据,用于训练机器人。

该公司未透露具体合作伙伴,但表示正与家政、酒店和餐饮行业的企业合作,已在多个地点部署了超过1000个活跃的头戴设备。

基于这一进展,Human Archive周二宣布获得了820万美元的融资,投资方包括Wing Venture Capital、NVP Capital、Y Combinator,以及来自OpenAI、Nvidia、Google、Mercor、AfterQuery、BAIR、SAIL、Brad Boa和Meta的天使投资人。

Human Archive由四位学生创立,三位来自加州大学伯克利分校,一位来自斯坦福大学,分别是Samay Maini、Rushil Agarwal、Shloke Patel和Raj Patel(后两者是堂兄弟,Raj Patel担任CEO)。他们均拥有机器人、硬件和触觉数据领域的研究背景。

公司的成立正是基于对AI行业未来发展的判断。随着机器人实验室和前沿AI公司竞相打造能在现实世界执行物理任务的机器,他们面临一个关键瓶颈——缺乏高质量、真实世界中人类执行日常工作的训练数据。Human Archive认为,印度蓬勃发展的零工经济中的工作人员正是这一数据的未开发且可扩展的来源。

尽管Human Archive与多家合作伙伴合作,但也遭到包括Pronto和Urban Company在内的多家印度家政服务公司的拒绝。

这一拒绝事件在上周末被印度媒体Entrackr报道,称Pronto正积极寻求合作以收集工人数据用于机器人训练,而Snabbit曾与Human Archive进行过早期讨论,但最终未能达成合作。

Urban Company CEO Abhiraj Singh Bhal在社交平台X上回应称,公司不会参与此类合作,随后Raj Patel反驳称Urban Company迟早会重新考虑,否则将面临客户流失的风险。联合创始人Rushil Agarwal则更直言不讳,称Pronto创始人Anjali Sardana在他提出数据合作想法时嘲笑他并称其“愚蠢”。Pronto承认曾有过对话,但选择不继续推进。

在印度其他地区,还有初创企业在工厂等不同工作环境收集第一人称数据。为了突出自身优势,Human Archive开发并使用触觉手套、全身动作捕捉服和手腕摄像头等多种设备,捕捉包括动作和触觉力在内的数据,并与RGB-D(实时颜色图像与深度信息)同步,向AI实验室出售。公司认为,仅有视频数据不足,结合其他传感器数据能极大提升数据价值。

最初,Human Archive使用临时设备或现成装备采集数据,现在则开发定制硬件,能够协同工作并捕捉多种数据类型。目前已部署超过50种不同设备收集多样数据点。

Patel在电话采访中表示:“我们最初用iPhone采集数据,随后打造了自有定制设备和帽子。现在我们有七种以上的硬件产品,可在不同模式间灵活切换。采集完不同设备的数据后,我们致力于同步这些数据源。”

公司还在开发利用自身数据微调AI模型,并在机器人上测试任务效果的方法,以此向潜在客户展示数据质量并进行内部模型训练。

Wing VC合伙人Zach DeWitt表示,Human Archive在多传感器数据采集方面具有独特优势。

“全球尚无人能大规模同步采集头戴RGB-D、力反馈、全身动作捕捉以及胸部和手腕摄像头数据。他们已在这些数据上进行内部模型训练,因传感器的新颖性和即将发布的大规模数据集,所有主要实验室和大学都对进行相关实验表现出浓厚兴趣。”他告诉TechCrunch。

尽管遭遇家政行业主要企业拒绝,Human Archive仍与较小的初创公司合作,向客户提供折扣服务。工人到访时,消费者可通过应用选择:支付折扣价并同意数据采集,或支付全价享受无录制服务。

Patel提到,客户普遍愿意选择前者,因为服务质量纠纷常见,视频记录有助于解决争议。

公司为参与第一人称数据采集的工人支付每小时1美元的基础报酬。经济时报报道,其他公司支付的时薪在250至400印度卢比(约合2.63至4.20美元)之间。Patel表示,竞争对手支付更高,但Human Archive在印度的本地化运营使其能保持较低的薪酬水平。

DeWitt称:“Human Archive的网络为全球用户提供即时且灵活的赚钱机会,降低了参与AI经济的门槛。我们认为这是一座关键桥梁,既支持当前生计,也为更安全、更高效的未来构建基础设施。”

除了薪酬,视频数据采集也引发隐私担忧。目前尚不清楚Human Archive向工人说明了多少关于其录像用途的信息。公司表示,其商业合同符合印度《数字个人数据保护法案》(DPDP),会展示隐私政策通知及数据采集目的和处理方式的同意信息。所有数据均匿名处理,录制中人脸会被模糊化。上周,Moneycontrol报道印度电子信息技术部正在调查通过家政工人采集第一人称数据的初创企业的同意机制和数据采集做法。

虽然Human Archive主要在印度采集数据,但已开始向东南亚和美国扩展。公司还在打造一个平台,允许任何人参与数据采集并赚取报酬。它计划在美国提供清洁或烹饪等服务,参与的工人通过数据采集获得报酬,目前这些项目仍处于早期试点阶段。

多家资金充足的初创企业正竞相打造物理AI。实现这一目标需要大量展示人类工作场景的训练数据,Human Archive正是满足这一需求的竞争者之一。其能否成功扩展,取决于其达成的合作伙伴关系以及所能收集数据的独特性和规模,能否满足物理AI实验室的需求。