人工智能模型让机器人在不熟悉的环境中执行任务 - 麻省理工学院技术评论

2024-09-20 10:12:08 英文原文

人工智能模型让机器人在不熟悉的环境中执行任务

机器人效用模型避免了每次机器人尝试在不熟悉的环境中执行某些操作时调整用于训练机器人的数据的需要。

让机器人在它们以前从未见过的环境中做事是很棘手的。通常,研究人员需要针对他们遇到的每个新地方使用新数据进行训练,这可能会变得非常耗时且昂贵。

现在研究人员已经开发了一系列人工智能模型,可以教机器人完成基本任务无需进一步培训或微调即可进入新环境。这五种人工智能模型被称为机器人实用模型(RUM),允许机器完成五项独立的任务,打开门和抽屉,以及在不熟悉的环境中捡起纸巾、袋子和圆柱形物体,成功率高达 90%。

该团队由来自纽约大学、Meta 和机器人公司 Hello Robot 的研究人员组成,希望其研究结果能够更快、更轻松地教授机器人新技能,同时帮助它们在以前未见过的领域发挥作用。这种方法可以使在家中部署机器人变得更容易、更便宜。

过去,人们非常关注这样的问题:我们如何让机器人做所有事情?但并没有真正问我们如何让机器人做他们知道如何在任何地方做的事情?参与该项目的纽约大学博士生 Mahi Shafiullah 说道。我们研究了如何教机器人在任何地方打开任何门?

教机器人新技能通常需要大量数据,而这是很难获得的。由于机器人训练数据需要物理收集,这是一项耗时且昂贵的工作,因此为机器人构建和扩展训练数据库比大型语言模型等人工智能类型要困难得多,大型语言模型是根据从互联网上抓取的信息进行训练的。

为了更快地收集教授机器人新技能所需的数据,研究人员开发了之前研究中使用的工具的新版本:连接到便宜的抓取棒的 iPhone,就是那种通常用于捡垃圾。

该团队使用该装置在 40 个不同的环境中记录了大约 1,000 次演示,其中包括纽约市和泽西市的家庭,针对其中一些已收集的五个任务中的每一个任务作为先前研究的一部分。然后,他们在五个数据集上训练学习算法,以创建五个 RUM 模型。

这些模型部署在 Stretch 上,这是一个机器人,由轮式单元、高杆和拿着 iPhone 的可伸缩臂组成,以测试他们在新环境中执行任务的成功程度,而无需进行额外的调整。虽然他们的完成率达到了 74.4%,但当研究人员从 iPhone 和机器人头戴式摄像头拍摄图像并将其提供给 OpenAI 最新的 GPT-4o LLM 模型时,他们能够将其成功率提高到 90%询问任务是否成功完成。如果 GPT-4o 拒绝,他们只需重置机器人并重试。

机器人专家面临的一个重大挑战是,在实验室环境中训练和测试他们的模型并不能代表现实世界中可能发生的情况,这意味着专门从事机器人操作的研究科学家 Mohit Shridhar 表示,帮助机器在新环境中更可靠地运行的研究非常受欢迎,他没有参与这项工作。

很高兴看到它在所有方面都得到了评估这些多样化的家庭和厨房,因为如果你能让机器人在野外随机的房子里工作,那就是机器人技术的真正目标,他说。

该项目可以作为构建的通用方法Shafiullah 说,其他任务的实用机器人模型有助于以最少的额外工作教授机器人新技能,并使没有经过培训的机器人专家的人们更容易在家中部署未来的机器人。

他说,我的目标是训练一些东西,把它放在互联网上,你应该能够下载它并在你家里的机器人上运行它。

深入研究

人工智能

为什么 OpenAI 的新模型如此重要

到目前为止,LLM 的大部分进展都是语言驱动的。这个新模型进入了复杂推理领域,对物理、编码等都有影响。

Google DeepMinds 的新人工智能系统现在可以解决复杂的数学问题

AlphaProof 和 A​​lphaGeometry 2构建可以推理的系统的步骤,这可以解锁令人兴奋的新功能。

OpenAI 发布了一个新的 ChatGPT 机器人,您可以与之交谈

支持语音的聊天机器人将可供今天的一小群人,以及秋季的所有 ChatGPT Plus 用户。

在 AI 垃圾上训练的 AI 吐出 AI 垃圾

随着 AI 编写的垃圾网页激增,依赖该数据的模型将受到影响。

保持联系


麻省理工学院技术评论获取最新更新

发现特别优惠、热门故事、即将举办的活动等等。

摘要

人工智能模型让机器人在不熟悉的环境中执行任务机器人效用模型避免了每次机器人尝试在不熟悉的环境中做某事时调整用于训练机器人的数据的需要。虽然他们的完成率达到了 74.4%,但当研究人员从 iPhone 和机器人头戴式摄像头拍摄图像并将其提供给 OpenAI 最新的 GPT-4o LLM 模型时,他们能够将其成功率提高到 90%询问任务是否成功完成。他说,很高兴看到它在所有这些不同的家庭和厨房中得到评估,因为如果你能让机器人在野外随机的房子里工作,那就是机器人技术的真正目标。沙菲乌拉说,该项目可以作为构建其他任务的其他实用机器人模型的通用方法,帮助以最少的额外工作教授机器人新技能,并使没有经过培训的机器人专家的人们更容易在家中部署未来的机器人。经过人工智能垃圾训练的人工智能会吐出人工智能垃圾随着人工智能编写的垃圾网页激增,依赖这些数据的模型将受到影响。