作者:Samantha Kelly Contributor
AI模型旨在帮助机器人导航和更直观地与周围的世界互动。
微软刚刚引入岩浆,一种新的人工智能模型旨在帮助机器人更聪明地看到,理解和行动。与传统不同人工智能模型,岩浆一次处理不同类型的数据 - Microsoft的努力使迈向“代理AI”的巨大飞跃,一个 或可以代表用户计划和执行任务的系统。
该模型结合了视觉和语言处理,对视频,图像,机器人数据和界面交互进行了培训,以使其比以前的模型更通用。
在其GitHub页面上,Microsoft研究团队概述了岩浆如何执行任务,例如如何操纵机器人并浏览用户界面(例如单击按钮)。
为了开发这项技术,该公司与马里兰大学,威斯康星大学麦迪逊分校和华盛顿大学的研究人员合作。
发射是随着技术巨头竞赛的发展,可以开发可以自动化日常生活方面的AI代理商。Google一直在推进以机器人技术为重点的语言模型,而 Openai的操作员工具旨在处理平凡的任务,例如进行预订,订购杂货以及通过在专用浏览器中键入,单击和滚动来填写表格。
微软项目的首席研究员江内杨告诉CNET,AI的未来不仅仅是开发聊天机器人的多模式基础模型。
他说:“我们认为,AI的下一个重要步骤是开发可以无缝理解和与数字和物理环境互动的代理商。”
他说,岩浆的意义在于它有能力弥合多模式AI代理的差距,因为传统的AI模型在言语智能方面表现出色,但通常在计划和现实世界中挣扎。
他解释说:“今天的机器人通常依靠针对特定数据的特定任务培训,从而导致其处理简单的日常任务的能力有限,更不用说将其推广到新任务和环境了。”“岩浆通过显着增强其言语和空间智能,使机器人能够将其行为扎根于数字或物理的环境,并精确有效地执行动作。”
同时,Forrester的首席分析师Craig Le Clair,也是随机自动化行为的作者,他说,新闻与市场研究公司的预测一致,2025年的2025个机器人项目中有25%将结合认知和身体自动化。他说,但是,辩论继续这一宣布和其他宣布表示真正的转折点还是更大的语言条目。
Le Clair说:“微软提供了重要的开发人员能力,但现在需要在指导生产性和安全的人类机器人互动中表现出领导才能。”