Ryan Daws 是 TechForge Media 的高级编辑,在撰写引人入胜的叙述和使复杂主题易于理解方面拥有十多年的经验。他的文章和对行业领袖的采访使他被 Onalytica 等组织认可为关键影响者。在他的领导下,出版物因其卓越的表现而受到 Forrester 等分析公司的赞扬。通过 X (@gadget_ry) 或 Mastodon (@gadgetry@techhub.social) 与他联系
麻省理工学院研究人员开发了一种机器人训练方法,可以减少时间和成本,同时提高对新任务和环境的适应性。
这种方法称为异构预训练变压器 (HPT),将来自多个来源的大量不同数据组合到一个统一的系统中,有效地创建了生成式 AI 模型可以处理的共享语言。这种方法与传统的机器人训练有很大不同,在传统的机器人训练中,工程师通常会在受控环境中收集单个机器人和任务的特定数据。
首席研究员 Lirui Wang(麻省理工学院电气工程和计算机科学研究生)认为,虽然许多人将训练数据不足视为关键挑战,但机器人技术,一个更大的问题在于大量不同的领域、模式和机器人硬件。他们的工作展示了如何有效地结合和利用所有这些不同的元素。
研究团队开发了一种统一各种数据类型的架构,包括相机图像、语言指令和深度图。HPT 利用类似于高级语言模型的转换器模型来处理视觉和本体感受输入。
在实际测试中,该系统表现出了显着的效果——在模拟场景和真实场景中均优于传统训练方法 20% 以上。即使机器人遇到与训练数据显着不同的任务,这种改进仍然有效。
研究人员收集了令人印象深刻的预训练数据集,其中包括 52 个数据集,涵盖四个类别的超过 200,000 条机器人轨迹。这种方法允许机器人从丰富的经验中学习,包括人类演示和模拟。
该系统的关键创新之一在于其对本体感觉的处理(机器人对其位置和运动的感知)。该团队设计的架构同样重视本体感觉和视觉,从而实现更复杂的灵巧运动。
展望未来,该团队的目标是增强 HPT 处理未标记数据的能力,类似于高级语言模型。他们的最终愿景是创建一个通用机器人大脑,无需额外培训即可下载并用于任何机器人。
尽管承认他们还处于早期阶段,但该团队仍然乐观地认为,扩展可能会导致机器人政策的突破性发展,类似于大型语言模型中所取得的进步。
您可以找到研究人员论文的副本这里(PDF)
(摄影:着魔摄影)
想向行业领导者了解更多关于人工智能和大数据的知识吗?查看人工智能与大数据博览会在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他主要活动同期举行,包括智能自动化大会,布洛克X,数字化转型周, 和网络安全与云博览会。
探索由 TechForge 提供支持的其他即将举行的企业技术活动和网络研讨会这里。
标签: 人工智能,人工智能,异构预训练 Transformer,HPT,麻省理工学院,机器人训练,机器人技术,机器人,训练