LeCun 离开 Meta 后押注世界模型,他要补上 LLM 最不擅长的现实感
据 BBC 报道,Yann LeCun 离开 Meta 后创立 AMI Labs,正在开发一种不同于 ChatGPT、Claude、Gemini 这类大语言模型的 AI 路线。这个方向叫 Joint Embedding Predictive Architecture,简称 JEPA,目标是让 AI 能建立对现实世界的抽
林岚
据 BBC 报道,Yann LeCun 离开 Meta 后创立 AMI Labs,正在开发一种不同于 ChatGPT、Claude、Gemini 这类大语言模型的 AI 路线。这个方向叫 Joint Embedding Predictive Architecture,简称 JEPA,目标是让 AI 能建立对现实世界的抽象模型,而不只是预测下一段文字。
这件事的核心不是“又一个 AI 大佬不看好 LLM”,而是 LeCun 把问题说得很工程化:LLM 擅长处理定义清楚、规律稳定的任务,比如写代码、解数学题、生成文本;但机器人要收拾厨房、搬东西、判断物体会怎么动,面对的是开放、连续、带物理约束的世界。这里光靠下一个 token 不够。
BBC 文章里有一个很直观的例子。LeCun 竖起一支笔,问松手后会发生什么。小孩都知道笔会倒,但没人能精确预测它往哪个方向倒。对现实智能来说,重要的是知道“会倒”和“不必猜具体方向”;对只会统计下一个输出的系统来说,它可能试图给出一个看似合理但并不可靠的单点预测。

JEPA 的想法是把现实场景压缩成有用的抽象表示,过滤掉没必要预测的细节,只保留和行动相关的信息。说白了,它不是让 AI 记住更多文本,而是让 AI 学会“这个世界哪些变化重要,哪些变化不用管”。这对机器人、工业控制、自动驾驶和复杂规划都更关键。
这也是为什么“世界模型”这个方向重新变热。牛津大学 Ingmar Posner 的团队、DeepMind 的 Genie、Wayve 的 Gaia、Fei-Fei Li 的 World Labs,都在类似问题上投入。大家不一定同意 LeCun 对 LLM 的批评有多重,但很多人承认,如果 AI 要进入物理世界,必须有比文本预测更强的状态理解和未来模拟能力。
林岚看这条新闻,会先把期待降一档。JEPA 和世界模型不是明天就能替代 LLM 的产品路线。它们更像补课:LLM 解决了语言接口和知识调用,世界模型要解决感知、因果、物理和行动后果。真正有用的系统,未来很可能是两者组合,而不是谁把谁彻底淘汰。
对开发者来说,短期影响不是“换模型”,而是判断应用场景。你做客服、写作、代码辅助、文档检索,LLM 仍然是最现实的工具;你做机器人、工业异常预测、模拟环境、自动驾驶,单纯把 LLM 接到传感器上就很危险。Demo 很好,SDK 呢?错误处理呢?现实世界里,一个错误动作可能不是回答错一句话,而是撞坏设备或伤到人。
本站的判断是,LeCun 这条路线的重要性在于提醒行业:智能不等于语言流畅。LLM 让机器更会说话,但下一阶段真正难的,是让机器知道自己身处什么世界、行动会造成什么后果、哪些不确定性应该保留。AI 如果要从屏幕走向工厂和家庭,现实感会比口才更重要。
参考来源
评论
围绕这篇文章补充信息、提出问题或分享观察。