机器人学会像你一样把现金放进钱包

2026年，机器人技术实现了飞跃式发展，灵巧度显著提升，这正是实现真正实用家用机器人所急需的进步。近日，一款新的人工智能模型问世，赋能机器人完成多种任务，包括折叠衣物、组装箱子、修理其他机器人，甚至像人类一样将纸币放入钱包。

本月早些时候，总部位于加州的Generalist AI发布了名为Gen-1的物理人工智能模型，使机器人能够成功执行上述任务及更多。Generalist AI的联合创始人兼CEO Pete Florence表示，这标志着基于现实世界智能设计的机器人迈出了重要一步。

在公司发布的大多数示范视频中，Gen-1运行于一对机械臂上，但它并不限于此。Florence指出：“Gen-1被设计为任何机器人的大脑，意味着同一模型可以运行于人形机器人、工业机械臂或其他机器人系统。”

今年被视为通用人形机器人突破之年，波士顿动力（Boston Dynamics）和荣耀（Honor）等公司纷纷推出动作极其逼真的先进机器人。摩根士丹利预测，到2050年，机器人市场规模将达到5万亿美元。机器人将首先进入工业、零售、酒店和护理领域，最终进入家庭。实现这一目标，人工智能的进一步发展至关重要。

训练机器人与人类共处

近年来，大型语言模型如ChatGPT、Gemini和Claude迅速发展，但驱动机器人的物理人工智能模型进展较慢，主要因缺乏训练数据。机器人，尤其是人形机器人，必须像人类一样学会在为人类设计的环境中行动。

通常，这类数据来自机器人在远程操控下执行任务，但Gen-1不同。Generalist AI通过让人类佩戴轻量级“数据手”设备，完成数百万项不同任务，收集了大量真实交互数据。

Florence解释：“我们开发了轻便的‘数据手’，并在全球范围内分发，以学习人们如何与物体互动，包括细微的力反馈、触觉感受、滑动、调整和恢复，这些定义了人类在现实世界中的灵巧度。这类数据对于教会机器人物理常识至关重要，使其具备直觉理解和实时适应能力，而非死板执行指令。”

Generalist AI发布了一系列视频，展示该模型在机器人上反复执行多种任务。其中最引人注目的是机器人从钱包中取出现金后再放回同一口袋。这是一项许多人类都会感到棘手的细致工作。考虑到纸币的脆弱和钱包的材质，这对机器人来说同样不易，但它成功完成了任务。

另一段视频展示机器人按颜色分类袜子，整齐叠放并通过触摸屏计数。其他复杂任务包括拉开拉链并将笔放入笔袋、将橘子整齐堆成金字塔形、插入以太网线等。

这些视频展示了Gen-1的广泛能力，更令人印象深刻的是其完成任务的成功率。Generalist AI对比了Gen-1与前一版本的表现，发现Gen-1在为机器人吸尘器服务时成功率达到99%（Gen-0为50%），折叠箱子成功率99%（Gen-0为81%），包装手机成功率99%（Gen-0为62%）。

机器人即兴应变能力

大多数机器人被编程为以特定且有序的方式完成任务，但环境中稍有变化就可能导致失败。Florence指出：“环境中最微小的变化都可能引发失败。”

机器人需要具备人类天生拥有的即兴应变能力。Gen-1正是为此设计，能够想出策略完成任务。举例来说，一台机器人在汽车零件装配任务中，虽然只接受过单手操作训练，却能用双手重新定位一个难以操作的零件。

Florence表示：“这种创造力在机器人领域此前几乎不存在。”

尽管机器人即兴能力仍需大量提升，但初步进展已显示出对可靠性和速度的积极影响。Florence说：“我们开始看到真正的进步，期待推动具身智能的边界。”

毕竟，未来或许会有一天，你家中需要一台机器人来修理其他小型机器人。

机器人学会像你一样把现金放进钱包

训练机器人与人类共处

机器人即兴应变能力

标签

评论

相关阅读

融合实践经验与生成式AI的“富士通AI驱动现代化服务”

OpenAI提出超智能社会的“AI权利”和“每周四天工作制”建议

社交媒体热议特朗普与AI版罗斯福总统对话：他真的以为是真人吗？