波士顿动力和丰田合作:教Atlas学习

2024-10-17 05:38:42 英文原文

作者:By Loz Blain

丰田研究院一直在做一些令人惊叹的工作,教导机器人快速学习并自主完成任务——现在,它将与波士顿动力公司合作,将其大型行为模型技术应用于非凡的Atlas人形机器人。

人形机器人硬件,信不信由你,可能已经足够好了。波士顿动力公司十多年的工作不仅造就了极其健壮且功能强大的液压Atlas机器人,而且还催生了一系列新兴的商业竞争对手。特斯拉, , 敏捷性, 避难所, 傅里叶以及许多其他机器人。这些非凡的机器人身体将继续改进,但它们已经足够好,可以完成各种有用的工作。

软件是问题所在。如果你需要一个编程团队来教会一个机器人新的行为,这几乎和今天的传统生产机器人没什么两样。但开发一个能够理解世界并以灵活和适应性方式与其互动的通用型人形机器人是一项巨大的任务。

The old Atlas: a broadly flamboyant and highly gymnastic fellow

旧版阿特拉斯:一个极其华丽且非常擅长体操的家伙

波士顿动力公司

答案是人工智能,当然了,就像很快一切问题的答案都会是人工智能——但是人工智能需要在大量数据上进行训练。ChatGPT、Grokl、Llama和Claude等都受益于几个世纪以来人类积累的海量(主要是文本)数据。大规模语言模型(LLMs)能够如此迅速地取得巨大进展,是因为语言是对现实的高度压缩表示,其文件大小非常小,因此可以处理大量的数据。

可供机器人学习基础运动的数据要少得多——除了视频,而视频并不能完全解释某人为什么做出某种动作。他们确实需要从头开始学习。因此提出了“大型行为模型”(LBM)的概念——这是一种让机器人逐步建立基本的可以用来与世界互动的动作的方式,并将这些基本动作组合成更复杂的动作以完成任务或实现目标的方法,类似于LLM已经发展出对人类语言的理解并学会了与我们互动的方式。

如果你没有看过丰田研究院(TRI)去年进行的LBM相关工作稍作休息,回顾一下:

教机器人新的行为

本质上,TRI团队开发了一套远程呈现系统,允许人类飞行员通过佩戴虚拟现实护目镜(由机器人的摄像头提供画面)“驾驶”机器人手臂,从而看到机器人所见的一切,并配备了触觉手套,让操作者也能感受到机器人触觉传感器感知到的触感。

然后,将人类飞行员限制在机器人具有的确切的“感官”范围内,他们开始执行一系列任务,其中许多任务是在厨房环境中完成的。他们会花费几个小时反复进行同一个任务,从不同的起点开始,纠正他们的错误,并标记每次尝试是成功还是失败。

从那里开始,机器人会花一些时间“思考”这个问题,实际上是在运行数百万种不同的任务模拟,同时加入随机变量和起始点,并根据他们自己对成功和失败模式的理解来评估自己的表现。

这奏效了。TRI团队在去年九月首次展示上述视频时,已经教会其机器人手臂超过60种复杂的操作行为。研究人员报告称,他们经常花一个下午的时间进行有指导的训练,然后回家让行为学习系统在夜间运行模拟,第二天早上回来发现机器人能够自主完成任务,并且相当灵活。

这非常令人印象深刻,我们很想知道它在过去一年里取得了多大的进展,考虑到所有领域的AI都在以惊人的速度发展。但这项研究也相当有限,使用的是机器人双臂而非整个机器人身体进行的。

告别高清地图集

好吧,这种情况即将改变。波士顿动力公司在机器人研究领域一直是绝对的黄金标准,并且几十年来一直如此。旧的液压阿特拉斯人形机器人将被载入史册,成为机器人历史上最具开创性和意义的机器之一。

以及全电动新型Atlas,您可能已经在New Atlas上看到过它,它在五个月前才首次公开亮相。这次显著的进化虽然失去了一些让最初的Atlas成为非凡体操运动员的那种爆发力——但通过在其全身配备可以完全旋转的关节,实现了臀部、肩膀、腰部、颈部、二头肌和大腿的自由旋转,因此其身体的任何部分都可以朝任意方向转动。从体操运动员到柔术大师……让我们来看看:

全新Atlas | Boston Dynamics

这确实是一款外观非凡的机器人,已经出现了划痕和凹陷,看起来非常像典型的Boston Dynamics产品的二手货,但在这过去的五个月里,我们很少见到这款新Atlas,因此很难确定它的具体进展及其目前的能力。除了这一点:我们知道它能做一套俯卧撑。

所以今天的新闻非常令人兴奋;人类机器人硬件领域的无可争议的领军团队,与人工智能LBM开发的领先团队合作,以提升人类机器人的实用能力。

波士顿动力公司首席执行官罗伯特·普莱特在一份新闻稿中表示:“对于机器人行业来说,现在是前所未有的激动人心的时刻,我们期待与TRI合作,加速通用型人形机器人的开发。”“这项合作是一个拥有强大研发基础的两家公司在许多复杂挑战上携手共进、打造能够解决现实世界问题的实用机器人的典范。”

丰田首席科学家、TRI首席执行官吉尔·普拉特补充说:“近年来,人工智能和机器学习在推进物理智能方面具有巨大的潜力。”“我们将TRI最先进的AI技术应用于波士顿动力公司的硬件上的机会对我们各自组织来说都是革命性的,因为我们致力于增强人类能力并改善生活质量。”

该合作旨在迅速开发Atlas机器人全身行为模型,但也适用于TRI可能与之合作的其他类人平台。由于Atlas比TRI最初使用的手动双臂设置复杂得多,因此将有哪些不同类型的远程呈现培训硬件应用于问题中将会很有趣。

Boston is not gentle on its robots; even the new Atlas looks like it's already been through the wars

波士顿对它的机器人可不温柔;即使是新的Atlas机器人都看起来已经历尽沧桑了。

波士顿动力公司

最终,波士顿动力公司是否打算将Atlas扩大为一款商用产品仍然不清楚。而规模可能在这里至关重要;像特斯拉和Figure这样的公司在设计他们的类人机器人时就考虑到了大规模生产,目标是部署数百台乃至数千台这样的设备,在现实世界中执行小型、简单且有用的 task。在那里,他们将会见证一系列非凡的事情发生,并收集大量的真实 world 数据,然后利用这些数据来推动群组学习的发展。注意这里的"task"和"world"需要替换为合适的中文词,此处应为“任务”和“世界的”。

这就是特斯拉声称使其成为自动驾驶汽车世界领导者的做法;目前已经上路的有数百万辆这样的车辆,它们不断观察并为整个系统的知识库做出贡献。在这个模型中,人工智能是一个大数据游戏,谁收集的数据最多、利用数据最有效的人就能获胜。据像埃隆·马斯克这样的人说,这场竞赛的奖品可能是历史上最大的产品——一种能够最终取代几乎所有体力劳动的变革性机器。

尽管波士顿动力公司在至少十年的时间里,在人形机器人领域遥遥领先,但Atlas特别被指定为一个研究平台。该公司将其商业活动限制在较小、更实用的四足机器人上,如其生产的大小和实用性更高的四足机器人。注意原文中的“its”没有明确指代对象,可能需要根据上下文进一步确定具体指的是哪种机器人产品。若要保持与原句结构一致且不增加额外信息,则翻译如下: 尽管波士顿动力公司在至少十年的时间里,在人形机器人领域遥遥领先,但Atlas特别被指定为一个研究平台。该公司将其商业活动限制在较小、更实用的四足机器人上,如其生产的。按需平台以及它的一款单臂重型起重型号伸缩盒处理器.

也许这家开拓性公司认为,人形机器人目前还无法投入工作,还需要在实验室中再进行几年的研究,仔细地构建物理行为的基础要素。

通用人形机器人的前景是如此巨大,面临的挑战也是如此艰巨,因此在前进的道路上肯定会有许多惊喜。这确实感觉像是一个我们正在实时见证未来历史发展的领域。

来源:波士顿动力公司

关于《波士顿动力和丰田合作:教Atlas学习》
暂无评论

摘要

丰田研究院一直在做一些令人惊叹的工作,教授机器人快速学习并自主完成任务——现在,它将大型行为模型技术与波士顿动力公司合作引入了Atlas人形机器人。因此提出了“大型行为模型”或LBM的概念:这是一种让机器人逐渐构建基本动作的方式,这些动作可用于与世界的互动,并将其组合成更复杂的动作以实现特定的任务或目标,类似于LLM(语言模型)对人类语言的理解和学习如何与我们互动的过程。从体操运动员到柔术士……请看: 全新Atlas | 波士顿动力公司 这是一个真正引人注目的机器人,外观已经划痕累累、凹凸不平,典型的波士顿动力公司的风格,但最近五个月我们几乎看不到这款新的Atlas的任何信息来确定它的实际位置以及当前的能力。规模可能在这里至关重要;像特斯拉和Figure这样的公司正在设计他们的人形机器人时考虑大规模生产,目标是部署数百甚至数千台机器人在世界上执行小而简单的有用任务。该公司将其商业活动限制在较小的实际四足动物上,如其Spot平台及其单臂重型举升箱处理机Stretch。