2026年,机器人技术实现了飞跃式发展,灵巧度显著提升,这正是实现真正实用家用机器人所急需的进步。近日,一款新的人工智能模型问世,赋能机器人完成多种任务,包括折叠衣物、组装箱子、修理其他机器人,甚至像人类一样将纸币放入钱包。

本月早些时候,总部位于加州的Generalist AI发布了名为Gen-1的物理人工智能模型,使机器人能够成功执行上述任务及更多。Generalist AI的联合创始人兼CEO Pete Florence表示,这标志着基于现实世界智能设计的机器人迈出了重要一步。

在公司发布的大多数示范视频中,Gen-1运行于一对机械臂上,但它并不限于此。Florence指出:“Gen-1被设计为任何机器人的大脑,意味着同一模型可以运行于人形机器人、工业机械臂或其他机器人系统。”

今年被视为通用人形机器人突破之年,波士顿动力(Boston Dynamics)和荣耀(Honor)等公司纷纷推出动作极其逼真的先进机器人。摩根士丹利预测,到2050年,机器人市场规模将达到5万亿美元。机器人将首先进入工业、零售、酒店和护理领域,最终进入家庭。实现这一目标,人工智能的进一步发展至关重要。

训练机器人与人类共处

近年来,大型语言模型如ChatGPT、Gemini和Claude迅速发展,但驱动机器人的物理人工智能模型进展较慢,主要因缺乏训练数据。机器人,尤其是人形机器人,必须像人类一样学会在为人类设计的环境中行动。

通常,这类数据来自机器人在远程操控下执行任务,但Gen-1不同。Generalist AI通过让人类佩戴轻量级“数据手”设备,完成数百万项不同任务,收集了大量真实交互数据。

Florence解释:“我们开发了轻便的‘数据手’,并在全球范围内分发,以学习人们如何与物体互动,包括细微的力反馈、触觉感受、滑动、调整和恢复,这些定义了人类在现实世界中的灵巧度。这类数据对于教会机器人物理常识至关重要,使其具备直觉理解和实时适应能力,而非死板执行指令。”

Generalist AI发布了一系列视频,展示该模型在机器人上反复执行多种任务。其中最引人注目的是机器人从钱包中取出现金后再放回同一口袋。这是一项许多人类都会感到棘手的细致工作。考虑到纸币的脆弱和钱包的材质,这对机器人来说同样不易,但它成功完成了任务。

另一段视频展示机器人按颜色分类袜子,整齐叠放并通过触摸屏计数。其他复杂任务包括拉开拉链并将笔放入笔袋、将橘子整齐堆成金字塔形、插入以太网线等。

这些视频展示了Gen-1的广泛能力,更令人印象深刻的是其完成任务的成功率。Generalist AI对比了Gen-1与前一版本的表现,发现Gen-1在为机器人吸尘器服务时成功率达到99%(Gen-0为50%),折叠箱子成功率99%(Gen-0为81%),包装手机成功率99%(Gen-0为62%)。

机器人即兴应变能力

大多数机器人被编程为以特定且有序的方式完成任务,但环境中稍有变化就可能导致失败。Florence指出:“环境中最微小的变化都可能引发失败。”

机器人需要具备人类天生拥有的即兴应变能力。Gen-1正是为此设计,能够想出策略完成任务。举例来说,一台机器人在汽车零件装配任务中,虽然只接受过单手操作训练,却能用双手重新定位一个难以操作的零件。

Florence表示:“这种创造力在机器人领域此前几乎不存在。”

尽管机器人即兴能力仍需大量提升,但初步进展已显示出对可靠性和速度的积极影响。Florence说:“我们开始看到真正的进步,期待推动具身智能的边界。”

毕竟,未来或许会有一天,你家中需要一台机器人来修理其他小型机器人。