作者:Ryan Browne
Meta平台首席执行官Mark Zuckerberg。在Openai,Microsoft和Google等球员的竞争中,人工智能一直是科技巨头领导者的不可或缺的重点。
大卫·保罗·莫里斯(David Paul Morris)|彭博|盖蒂图像
元周三,它将推出一种新的AI“世界模型”,可以更好地了解3D环境和物理对象的运动。
拥有流行的社交媒体应用Facebook和Instagram的技术巨头表示,其新的开源AI Model V-JEPA 2可以在物理世界中理解,预测和计划。这些系统被称为世界模型,从物理世界的逻辑中汲取灵感,以建立对现实的内部模拟,使AI以更像人性化的方式学习,计划和做出决策。
例如,在Meta的新型号的情况下,V-JEPA 2可以认识到一个球从桌子上滚下来的球将掉落,或者隐藏的对象并不只是消失。
人工智能一直是元首席执行官马克·扎克伯格(Mark Zuckerberg)的重点微软和谷歌。元是将向人工智能公司AI投资140亿美元并聘请其首席执行官亚历山德·王(Alexandr Wang)来加强其AI策略,熟悉此事的人告诉CNBC。
Meta吹捧了其新的V-JEPA 2模型在运输机器人和自动驾驶汽车等机器中的好处。这些机器需要能够实时理解周围环境,以浏览物理世界。
这家科技巨头说,V-JEPA不依赖大量标记的数据或视频录像,而是在简化的“潜在”空间中的2个原因来理解对象如何移动,交互和响应。
梅塔(Meta)首席AI科学家Yann Lecunn在周三在巴黎的Viva Tech会议上的视频演讲中说:“允许机器理解物理世界与允许他们理解语言的不同之处大不相同。”
他补充说:“世界模型就像是现实的抽象数字双胞胎,AI可以参考了解世界的影响并预测其行动的后果,因此它将能够计划采取行动以完成给定的任务。”
世界模型吸引了人工智能社区中的嗡嗡声最近,研究人员将超越生成AI应用程序背后的大型语言模型,例如Openai的Chatgpt和谷歌双子座。
去年9月,领先的AI研究员Fei-Fei Li为一家名为World Labs的新创业公司筹集了2.3亿美元,该公司旨在创建所谓的“大世界模型”,以更好地了解物理世界的结构。
同时,Google的DeepMind单元一直在开发自己的名为Genie的世界模型,它说可以实时模拟游戏和3D环境。