英语轻松读发新版了,欢迎下载、更新

微软的岩浆AI可以操纵和控制机器人

2025-02-21 18:12:00 英文原文

作者:Samantha Kelly Contributor

AI模型旨在帮助机器人导航和更直观地与周围的世界互动。

Headshot of Samantha Kelly

萨曼莎·凯利(Samantha Kelly)是一位自由作家,专注于消费技术,AI,社交媒体,大型技术,新兴趋势以及它们如何影响我们的日常生活。她的作品已在CNN,NBC,NPR,BBC,Mashable等等。

微软刚刚引入岩浆,一种新的人工智能模型旨在帮助机器人更聪明地看到,理解和行动。与传统不同人工智能模型,岩浆一次处理不同类型的数据 - Microsoft的努力使迈向“代理AI”的巨大飞跃,一个 或可以代表用户计划和执行任务的系统。

AI Atlas art badge tag

该模型结合了视觉和语言处理,对视频,图像,机器人数据和界面交互进行了培训,以使其比以前的模型更通用。 

在其GitHub页面上,Microsoft研究团队概述了岩浆如何执行任务,例如如何操纵机器人并浏览用户界面(例如单击按钮)。 

为了开发这项技术,该公司与马里兰大学,威斯康星大学麦迪逊分校和华盛顿大学的研究人员合作。

发射是随着技术巨头竞赛的发展,可以开发可以自动化日常生活方面的AI代理商。Google一直在推进以机器人技术为重点的语言模型,而 Openai的操作员工具旨在处理平凡的任务,例如进行预订,订购杂货以及通过在专用浏览器中键入,单击和滚动来填写表格。

微软项目的首席研究员江内杨告诉CNET,AI的未来不仅仅是开发聊天机器人的多模式基础模型。

他说:“我们认为,AI的下一个重要步骤是开发可以无缝理解和与数字和物理环境互动的代理商。”

他说,岩浆的意义在于它有能力弥合多模式AI代理的差距,因为传统的AI模型在言语智能方面表现出色,但通常在计划和现实世界中挣扎。

他解释说:“今天的机器人通常依靠针对特定数据的特定任务培训,从而导致其处理简单的日常任务的能力有限,更不用说将其推广到新任务和环境了。”“岩浆通过显着增强其言语和空间智能,使机器人能够将其行为扎根于数字或物理的环境,并精确有效地执行动作。”

同时,Forrester的首席分析师Craig Le Clair,也是随机自动化行为的作者,他说,新闻与市场研究公司的预测一致,2025年的2025个机器人项目中有25%将结合认知和身体自动化。他说,但是,辩论继续这一宣布和其他宣布表示真正的转折点还是更大的语言条目。

Le Clair说:“微软提供了重要的开发人员能力,但现在需要在指导生产性和安全的人类机器人互动中表现出领导才能。”

关于《微软的岩浆AI可以操纵和控制机器人》的评论


暂无评论

发表评论

摘要

Microsoft引入了Magma,这是一种AI模型,旨在使机器人通过同时处理多种类型的数据来智能地观察,理解和行动。这是Microsoft朝着能够自动计划和执行任务的“代理AI”系统推动的一部分。经过视频,图像,机器人数据和界面交互的培训,岩浆的目标是比以前的型号更具用途,从而可以更好地操纵机器人和对用户界面的导航。该发展是与几所大学的合作,并且在像Google和OpenAI这样的科技巨头努力中开发了可以处理日常任务的AI代理商的努力。微软的主要研究人员强调了弥合多模式AI代理人的口头智能和现实世界动作能力之间差距的重要性。