模仿学习框架增强四足机器人在野外的局部操作技能

2024-12-06 12:51:01 英文原文

WildLMa could enhance the performance of quadruped robots on long horizon loco-manipulation tasks the wild — 一只机器狗在草坪上捡起网球。图片来源：Yuchen Song/加州大学圣地亚哥分校。

集成机械手的四足机器人有可能解决需要在周围环境中快速移动的同时操纵物体的任务。这些任务包括收集房子周围的垃圾、收集特定物品并将其带给人类或将目标物品存放在特定位置。

许多旨在训练机器人成功完成这些任务的方法都依赖于模仿学习。这意味着规划机器人动作的算法会学习允许机器人动作的策略。机器人通过处理显示代理如何处理此任务的演示数据来完成任务。虽然一些现有的训练机器人执行涉及运动和物体操纵的任务的方法在模拟中取得了有希望的结果，但它们通常在“野外”表现不佳。

这本质上意味着它们不允许机器人在现实环境中测试时很好地概括各种任务。

加州大学圣地亚哥分校的研究人员最近推出了 WildLMa，这是一个新框架，可以提高野外四足机器人的长视距局部操纵技能。该框架概述于纸于arXiv预印本服务器具有三个组件，可以共同提高通过模仿学习学到的技能的通用性。

该论文的作者 Yuchen Song 告诉 Tech Xplore：“模仿学习的快速进步使机器人能够从人类的演示中学习。”

“然而，这些系统通常专注于孤立的特定技能，并且难以适应新环境。我们的工作旨在通过使用视觉语言模型（VLM）训练机器人获得通用技能，然后利用大型语言模型来克服这一限制。法学硕士）将这些技能链接成序列，使机器人能够处理复杂的任务。”

图片来源：WildLMa

宋和他的同事设计的框架WildLMa首先提供了一种收集专家演示数据的简单方法。这是通过一个实现的虚拟现实基于VR（VR）的远程操作系统，人类代理可以利用预先训练的机器人控制算法，仅用单手来控制机器人的全身运动。

“这些预先训练的技能随后通过法学硕士得到增强，这打破了复杂的任务宋解释说：“将其分解为可管理的步骤，类似于人类应对挑战的方式（例如，‘选择-导航-放置’）。”结果是机器人能够高效、直观地执行长时间、多步骤的任务”。

该研究团队引入的方法的一个显着特征是它还集成了注意力机制。这些机制允许机器人在完成特定任务时专注于目标物体。

“注意力机制的整合在使机器人的技能更具适应性和通用性方面发挥着关键作用，”宋说。“WildLMa 的潜在应用包括实际的家务劳动，例如整理或检索物品。我们已经展示了其中一些功能。”

宋和他的同事已经在一系列现实世界的实验中展示了他们的框架的潜力，他们成功地训练了一个四足机器人来完成各种任务。这些任务包括清理加州大学圣地亚哥分校走廊和室外空间的垃圾、领取外卖食品以及重新摆放书架上的物品。

“虽然我们的系统运行良好，但它仍然可能受到意外干扰的影响，例如人们走动，”宋补充道。“我们的下一步将涉及使系统在动态环境中更加稳健。最终，我们的目标是创造每个人都负担得起且易于使用的家庭助理机器人。”

更多信息：Ri-Zhao Qiu 等人，WildLMa：野外长视野局部操纵，arXiv（2024）。DOI：10.48550/arxiv.2411.15131

更多视频请点击这里：https://wildlma.github.io/

期刊信息： arXiv

引文:模仿学习框架增强四足机器人在野外的局部操作技能（2024 年，12 月 6 日）检索日期：2024 年 12 月 7 日来自 https://techxplore.com/news/2024-12-imitation-framework-quadruped-robots-loco.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外，不得未经书面许可，不得复制部分内容。所提供的内容仅供参考。

关于《模仿学习框架增强四足机器人在野外的局部操作技能》的评论

暂无评论

发表评论

摘要

加州大学圣地亚哥分校的研究人员开发了 WildLMa，这是一种新框架，可增强四足机器人在现实环境中执行长视距运动和操作任务的能力。该系统使用模仿学习并利用视觉语言模型（VLM）和大型语言模型（LLM）使机器人能够有效地执行复杂的动作序列。主要功能包括基于 VR 的远程操作系统，用于收集专家演示和注意力机制，以提高适应性和通用性。该框架已经在现实世界的实验中进行了测试，展示了垃圾收集和对象操作等功能。未来的工作旨在增强动态环境中的稳健性并开发负担得起的家庭助理机器人。

模仿学习框架增强四足机器人在野外的局部操作技能

关于《模仿学习框架增强四足机器人在野外的局部操作技能》的评论

发表评论

摘要

相关新闻

相关讨论