Meta的人工智能负责人表示,“世界模型”是实现“人类水平的人工智能”的关键——但可能还需要十年时间 | TechCrunch

2024-10-17 01:54:46 英文原文

作者:Maxwell Zeff

今天的AI模型真的像人脑一样在记忆、思考、规划和推理吗?一些AI实验室会让你相信它们能做到,但根据Meta首席人工智能科学家扬·乐库恩的说法,答案是否定的。然而,他认为通过追求一种叫做“世界模型”的新方法,我们可能在十年左右的时间内实现这一目标。

今年早些时候,OpenAI 发布了一个它称为“的新功能:内存“使得ChatGPT能够‘记住’你的对话。这家初创公司的最新一代模型,o1显示“思考”一词的同时生成输出,而OpenAI表示同样的模型能够进行“复杂推理”。

那听起来我们离AGI已经很近了。然而,在一个会议上最近在哈德逊论坛上的演讲莱康打击了人工智能乐观主义者,如xAI创始人埃隆·马斯克和谷歌深度思维联合创始人夏恩·莱格,他们认为人类水平的人工智能即将实现。

“我们需要能够理解世界的机器;能够记住事情、具有直觉、具备常识,能够像人类一样推理和规划的机器,”在演讲中勒坤说道。“尽管你可能从一些最热情的人那里听到不同的说法,目前的AI系统都不具备这些能力。”

莱康表示,当今像ChatGPT和Meta AI这样的大型语言模型还远远达不到“人类级别的人工智能”。他后来说,人类可能还需要“几年到几十年”的时间才能实现这一目标。(但这并没有阻止他的老板马克·扎克伯格问他AGI何时会出现。)

原因很简单:这些大语言模型通过预测下一个标记(通常是几个字母或一个短词)来工作,而当今的图像/视频模型则通过预测下一个像素来工作。换句话说,语言模型是一维预测器,而AI图像/视频模型是二维预测器。这些模型在其各自的维度上已经变得非常擅长进行预测,但它们并不真正理解三维世界。

因此,现代人工智能系统无法完成大多数人类都能轻松做到的简单任务。LeCun指出,人类在10岁时就能学会收拾餐桌,在17岁的时候就能学会开车——这两项技能都是在短短几个小时内掌握的。但是即使当今世界上最先进的AI系统,即便基于数千或数百万小时的数据训练,也无法可靠地在现实世界中运行。

为了完成更复杂的任务,LeCun建议我们需要构建三维模型,以便感知你周围的环境,并围绕一种新的AI架构:世界模型。

“世界模型是你对世界运行方式的心理模型,”他解释说。“你可以想象一系列你可能采取的行动,而你的世界模型将允许你预测这一系列行动会对世界产生什么影响。”

考虑你头脑中的“世界模型”。例如,想象一下看着一个杂乱的卧室并希望将其整理干净。你可以想象把所有的衣服捡起来放好就能解决问题。你不需要尝试多种方法,也不需要先学会如何打扫房间。你的大脑观察三维空间,并制定出一次性实现目标的动作计划。这个动作计划就是AI世界模型所承诺的秘密武器。

这里的好处之一是世界模型可以处理比大型语言模型更多的数据。这也使得它们在计算上更加密集,这就是为什么云提供商争相与人工智能公司合作.

世界模型是目前几个AI实验室争相研究的重大理念,这个词迅速成为吸引风险投资的下一个流行术语。包括李飞飞和贾斯汀·约翰逊在内的几位备受尊敬的AI研究人员刚刚筹集到了资金。2.3亿美元用于他们的初创公司,世界实验室。人工智能的“教母”及其团队也确信,世界模型将解锁更智能的人工智能系统。OpenAI还描述了其尚未发布的产品索拉视频生成器作为一个世界模型,但还没有进入具体细节。

LeCun提出了使用世界模型来创建人类水平的人工智能的一个想法。2022年论文关于“目标驱动的人工智能”,尽管他提到这个概念已经超过60年了。简而言之,一个世界的基本表示(例如,一间脏房间的视频)和记忆被输入到一个世界模型中。然后,根据这些信息,该世界模型预测这个世界将是什么样子。接着你给世界模型设定目标,包括希望实现的世界状态的变化(比如清洁的房间),以及确保模型不会为了达成目标而伤害人类的安全措施(请不要在打扫房间的过程中杀死我)。最后,世界模型会找到一系列行动来实现这些目标。

Meta的长期人工智能研究实验室FAIR(基础人工智能研究)正积极致力于构建目标驱动的人工智能和世界模型,根据LeCun的说法。FAIR过去曾为Meta即将推出的产品进行人工智能研究,但LeCun表示该实验室近年来已转向专注于长期的人工智能研究。LeCun说,如今FAIR甚至不使用大语言模型。

世界模型是一个引人入胜的想法,但莱康说我们在将这些系统变为现实方面进展不大。从我们现在的位置到实现这一目标还有很长的路要走,他说这肯定比我们想象的要复杂得多。

“我们需要几年的时间才能让这里的一切运行起来,如果不是十年的话,”勒库恩说。“马克·扎克伯格一直问我需要多长时间。”

关于《Meta的人工智能负责人表示,“世界模型”是实现“人类水平的人工智能”的关键——但可能还需要十年时间 | TechCrunch》的评论


暂无评论

发表评论

摘要

今天的AI模型真的像人类大脑一样在记忆、思考、规划和推理吗?LeCun表示,当今的大型语言模型,如驱动ChatGPT和Meta AI的语言模型,离“人类水平的人工智能”还相差甚远。你的大脑可以观察三维空间,并制定一个行动计划以一次性实现目标。这里的一个好处是,世界模型能够处理比LLM(大规模语言模型)多得多的数据。世界模型是一个引人入胜的想法,但LeCun说我们在将这些系统变为现实方面几乎没有取得多少进展。