OC

Knowledge OS
鹦鹉螺口语
Yann LeCun 的新事业是对大型语言模型的逆势押注
2026-01-22 10:00:00 · 英文原文

Yann LeCun 的新事业是对大型语言模型的逆势押注

作者:By Caiwei Chenarchive page

Yann LeCun 是图灵奖获得者、顶级人工智能研究员,但他长期以来一直是科技界的逆势人物。他认为,业界目前对大型语言模型的痴迷是错误的,最终将无法解决许多紧迫的问题。 

相反,他认为我们应该把赌注押在世界模型上——一种能够准确反映现实世界动态的不同类型的人工智能。他也是开源人工智能的坚定倡导者,并批评 OpenAI 和 Anthropic 等前沿实验室的封闭方法。 

那么,他最近离开 Meta 或许也就不足为奇了,他曾在 Meta 担任 FAIR(基础人工智能研究)的首席科学家,这是他创办的公司颇具影响力的研究实验室。Meta 一直难以通过其开源人工智能模型 Llama 获得太多关注,并经历了内部重组,包括对 ScaleAI 的有争议的收购。 

LeCun 坐下来麻省理工科技评论在他巴黎的公寓里接受独家在线采访,讨论他的新事业、Meta之后的生活、人工智能的未来,以及为什么他认为这个行业正在追逐错误的想法。 

为了清晰和简洁,下面的问题和答案都经过编辑。

您刚刚宣布成立一家新公司,高级机器智能 (AMI)。请告诉我它背后的伟大想法。

它将成为一家全球性公司,但总部位于巴黎。你将其发音为“ami”,在法语中的意思是“朋友”。我很兴奋。欧洲的人才非常集中,但并不总是能够提供适当的发展环境。行业和政府当然对一家既不是中国也不是美国的可靠的前沿人工智能公司有巨大的需求。我认为这对我们有利。

这是我们目前拥有的中美二元格局的一个雄心勃勃的替代方案。是什么让你想要追求第三条道路?

嗯,很多国家都存在主权问题,他们希望对人工智能有一定的控制权。我提倡的是人工智能将成为一个平台,而且大多数平台都倾向于开源。不幸的是,这并不是美国工业界真正的发展方向。正确的?随着竞争的加剧,他们觉得自己必须保密。我认为这是一个战略错误。

对于 OpenAI 来说确实如此,它从非常开放到非常封闭,而 Anthropic 一直是封闭的。谷歌有点开放。然后是 Meta,我们拭目以待。我的感觉是,目前情况并没有朝着积极的方向发展。

与此同时,中国也完全接受了这种开放的态度。所以所有领先的开源人工智能平台都是中国的,结果是美国以外的学术界和初创公司基本上都接受了中国模式。这没有什么错——你知道,中国模式很好。中国的工程师和科学家是伟大的。但你知道,如果未来我们所有的信息饮食都由人工智能辅助来调节,那么选择要么是总是与美国关系密切的专有公司生产的英语模型,要么是可能是开源但需要微调的中国模型,以便它们回答有关 1989 年天安门广场的问题——你知道,这不是一个非常愉快和引人入胜的未来。 

它们(未来的模型)应该能够由任何人进行微调,并产生高度多样化的人工智能援助,具有不同的语言能力、价值体系以及政治偏见和利益中心。您需要高度多样化的帮助,就像您需要高度多样化的媒体一样。 

这无疑是一个令人信服的宣传。到目前为止,投资者对这个想法的接受程度如何?

他们真的很喜欢它。很多风险投资家都非常赞成这种开源的想法,因为他们知道对于很多小型初创公司来说,他们确实依赖开源模式。他们没有办法训练自己的模型,而且从战略上来说采用专有模型对他们来说有点危险。

您最近离开了 Meta。您对公司和马克·扎克伯格的领导力有何看法?有人认为 Meta 已经失去了其人工智能优势。

我认为 FAIR [LeCun 在 Meta 的实验室] 在研究部分非常成功。Meta 不太成功的地方在于继续研究并将其推向实用的技术和产品。马克做出了一些他认为对公司最有利的选择。我可能并不同意他们所有人的观点。例如,FAIR 的机器人团队被解雇,我认为这是一个战略错误。但我不是 FAIR 的主管。人们会理性地做出决定,没有理由感到不安。

那么,没有坏血缘吗?Meta 会成为 AMI 未来的客户吗?

Meta 可能是我们的第一个客户!我们拭目以待。我们所做的工作不属于直接竞争。我们对物理世界的世界模型的关注与他们对生成人工智能和法学硕士的关注有很大不同。

早在法学硕士成为主流方法之前,您就已经开始研究人工智能了。但自从 ChatGPT 爆发以来,法学硕士几乎成了人工智能的代名词。

是的,我们将改变这一点。人工智能的公众形象也许主要是法学硕士和各种类型的聊天机器人。但其中最新的并不是纯粹的法学硕士。它们是法学硕士加上很多东西,比如感知系统和解决特定问题的代码。因此,我们将把法学硕士视为系统中的某种协调者。

除了法学硕士之外,还有很多人工智能在幕后运行着我们社会的很大一部分。汽车中有辅助驾驶程序、快速转动的 MRI 图像、驱动社交媒体的算法——这就是所有人工智能。 

您一直直言不讳地认为法学硕士只能让我们到目前为止。您认为现在 LLM 是否被过度炒作了?您能否向我们的读者总结一下为什么您认为 LLM 还不够?

从某种意义上说,它们并没有被过分夸大,它们对很多人来说都非常有用,特别是当你编写文本、进行研究或编写代码时。法学硕士能够很好地驾驭语言。但人们有这样的错觉或错觉,认为我们迟早能将它们扩展到人类水平的智能,这是完全错误的。

真正困难的部分是理解现实世界。这就是莫拉维克悖论(计算机科学家汉斯·莫拉维克在 1988 年观察到的现象):对我们来说容易的事情,比如感知和导航,对计算机来说却很难,反之亦然。法学硕士仅限于离散的文本世界。他们无法真正推理或计划,因为他们缺乏世界模型。他们无法预测自己行为的后果。这就是为什么我们没有像家猫一样敏捷的家用机器人,也没有真正的自动驾驶汽车。

我们将拥有具有类人和人类水平智能的人工智能系统,但它们不会建立在法学硕士的基础上,而且明年或两年后也不会发生。这需要一段时间。在我们拥有具有人类水平智能的人工智能系统之前,必须在概念上取得重大突破。这就是我一直在努力的方向。AMI Labs 公司专注于下一代。

你的解决方案是世界模型和 JEPA 架构(JEPA 或“联合嵌入预测架构”,是一种训练 AI 模型来理解世界的学习框架,由 LeCun 在 Meta 时创建)。电梯间距是多少?

世界是不可预测的。如果您尝试构建一个预测未来每个细节的生成模型,它将失败。JEPA 不是生成人工智能。这是一个能够很好地学习表示视频的系统。关键是学习世界的抽象表示,并在抽象空间中做出预测,忽略你无法预测的细节。这就是 JEPA 所做的事情。它通过观察来学习世界的基本规则,就像婴儿学习重力一样。这是常识的基础,也是构建能够在现实世界中进行推理和规划的真正智能系统的关键。迄今为止,这方面最令人兴奋的工作来自学术界,而不是陷入法学硕士世界的大型工业实验室。

非文本数据的缺乏一直是人工智能系统进一步理解物理世界的一个问题。JEPA 接受过视频训练。您还将使用哪些其他类型的数据?

我们的系统将接受各种视频、音频和传感器数据的训练,而不仅仅是文本。我们正在研究各种模式,从机器人手臂的位置到激光雷达数据再到音频。我还参与了一个使用 JEPA 来模拟复杂的物理和临床现象的项目。 

您设想的世界模型有哪些具体的、现实的应用?

应用范围非常广泛。想想复杂的工业流程,其中有数千个传感器,例如喷气发动机、钢厂或化工厂。目前还没有技术可以构建这些系统的完整、整体模型。世界模型可以从传感器数据中学习这一点并预测系统的行为方式。或者想象一下智能眼镜,它可以观察您正在做的事情,识别您的行为,然后预测您下一步要做什么来帮助您。这最终将使代理系统变得可靠。一个应该在世界上采取行动的代理系统无法可靠地工作,除非它有一个世界模型来预测其行动的后果。没有它,系统将不可避免地出错。这是解锁从真正有用的家用机器人到 5 级自动驾驶的一切的关键。

人形机器人最近很流行,尤其是中国公司制造的机器人。您怎么看?

有所有这些蛮力方法可以绕过学习系统的局限性,这些局限性需要大量的训练数据才能完成任何任务。所以所有公司让机器人做功夫或跳舞的秘密就在于它们都是提前计划好的。但坦率地说,没有人——绝对没有人——知道如何让这些机器人足够聪明,变得有用。相信我的话。 


每一项任务都需要大量的远程操作训练数据,而当环境发生一点点变化时,它就不能很好地概括。这告诉我们我们错过了一些非常重要的东西。17岁的孩子之所以能在20小时内学会开车,是因为他们已经非常了解这个世界是如何运作的。如果我们想要一个普遍有用的家用机器人,我们需要系统对物理世界有很好的理解。除非我们拥有良好的世界模型和规划,否则这不会发生。

人们越来越认为,由于需要大量的计算资源,在学术界进行基础人工智能研究变得越来越困难。您认为现在最重要的创新将来自工业吗?

不。法学硕士现在是技术开发,而不是研究。确实,由于对计算、数据访问和工程支持的要求,学术界很难在那里发挥重要作用。但它现在是一种产品。这不是学术界应该感兴趣的事情。就像 2010 年代初的语音识别一样,这是一个已解决的问题,而进步掌握在工业界手中。 

学术界应该致力于超越当前系统能力的长期目标。这就是为什么我告诉大学里的人:不要攻读法学硕士。没有意义。您将无法与行业中正在发生的事情竞争。做点别的事吧。发明新技术。突破不会来自扩大法学硕士的规模。关于世界模型最令人兴奋的工作来自学术界,而不是大型工业实验室。在神经网络中使用注意力回路的整个想法来自蒙特利尔大学。那篇研究论文开启了整个革命。现在大公司都在倒闭,突破的速度就会放缓。学术界需要获得计算资源,但他们应该专注于下一件大事,而不是完善上一件大事。

您身兼数职:教授、研究员、教育家、公共思想家……现在您刚刚戴上一顶新帽子。对你来说,那会是什么样子?

我将担任公司的执行董事长,Alex LeBrun(Meta AI 的前同事)将担任首席执行官。这将是 LeCun 和 LeBrun,如果你用法语发音那就太好了。

我将保留在纽约大学的职位。我每年教一堂课,有博士生和博士后,所以我将留在纽约。但因为我的实验室,我经常去巴黎。 

这是否意味着您不会亲自动手?

嗯,有两种方法可以亲自动手。一是日常管理人员,二是实际参与研究项目,对吗? 

我可以做管理,但我不喜欢做。这不是我的人生使命。这实际上是尽我们所能推动科学技术进步,激励其他人从事有趣的事情,然后为这些事情做出贡献。这就是过去七年我在 Meta 的角色。我创立了 FAIR 并领导了它四到五年。我有点讨厌当导演。我不擅长职业管理这件事。我更有远见,也是一名科学家。

是什么让亚历克斯·勒布伦 (Alex LeBrun) 成为合适人选?

Alex 是一位连续创业者;他创建了三家成功的人工智能公司。第一个他卖给了微软;第二个是 Facebook,他是巴黎 FAIR 工程部门的负责人。然后他离开并创建了 Nabla,这是一家在医疗保健领域非常成功的公司。当我向他提供加入我的努力的机会时,他几乎立即接受了。他拥有创建公司的经验,让我能够专注于科学和技术。 

您的总部位于巴黎。您还计划在哪里设立办事处?

我们是一家全球性公司。将在北美设立一个办事处。

纽约,希望吗?

纽约很棒。这就是我所在的地方,对吗?而且这里不是硅谷。硅谷有点单一文化。

亚洲呢?我猜新加坡也是如此?

可能是的。我让你猜一下。 

你们如何吸引人才?

我们在招聘方面没有任何问题。人工智能研究界有很多人认为人工智能的未来在于世界模型。这些人,无论薪资待遇如何,都会有动力为我们工作,因为他们相信我们正在建设的技术未来。我们已经从 OpenAI、Google DeepMind 和 xAI 等地方招募了人员。

我听说来自纽约大学和谷歌 DeepMind 的著名研究员谢赛宁可能会加入你们担任首席科学家。有什么意见吗?

赛宁是一位杰出的研究员。我对他非常钦佩。我已经两次雇用他了。我在 FAIR 聘用了他,并说服了纽约大学的同事我们应该在那里聘用他。只能说我非常尊重他。

您什么时候准备好分享有关 AMI 实验室的更多详细信息,例如财务支持或其他核心成员?

很快——也许是二月。我会让你知道的。

关于《Yann LeCun 的新事业是对大型语言模型的逆势押注》的评论

暂无评论

发表评论

摘要

图灵奖获得者、著名人工智能研究员 Yann LeCun 宣布创建高级机器智能 (AMI),总部位于巴黎,旨在开发准确反映现实世界动态的世界模型。与当前行业对大语言模型 (LLM) 的关注相反,LeCun 提倡开源 AI,并批评 OpenAI 和 Anthropic 等封闭方法。他离开了 Meta,担任 FAIR 首席科学家,理由是在机器人研究削减和转向专有模型方面存在战略分歧。AMI 旨在为人工智能开发中的中美二元格局提供替代方案,重点关注 JEPA 架构,以创建能够理解和预测现实世界场景的智能系统。LeCun 计划与首席执行官 Alex LeBrun 密切合作,同时保留在纽约大学的职位。该公司寻求在全球范围内吸引人才,强调开源平台和多元化观点在推进人工智能技术方面的重要性。