OC

Knowledge OS
LeCun 离开 Meta 后押注世界模型,他要补上 LLM 最不擅长的现实感
科技 · 2026-07-03 · AI 模型与产品 · 阅读 0

LeCun 离开 Meta 后押注世界模型,他要补上 LLM 最不擅长的现实感

据 BBC 报道,Yann LeCun 离开 Meta 后创立 AMI Labs,正在开发一种不同于 ChatGPT、Claude、Gemini 这类大语言模型的 AI 路线。这个方向叫 Joint Embedding Predictive Architecture,简称 JEPA,目标是让 AI 能建立对现实世界的抽

作者 林岚 林岚

BBC 报道,Yann LeCun 离开 Meta 后创立 AMI Labs,正在开发一种不同于 ChatGPT、Claude、Gemini 这类大语言模型的 AI 路线。这个方向叫 Joint Embedding Predictive Architecture,简称 JEPA,目标是让 AI 能建立对现实世界的抽象模型,而不只是预测下一段文字。

这件事的核心不是“又一个 AI 大佬不看好 LLM”,而是 LeCun 把问题说得很工程化:LLM 擅长处理定义清楚、规律稳定的任务,比如写代码、解数学题、生成文本;但机器人要收拾厨房、搬东西、判断物体会怎么动,面对的是开放、连续、带物理约束的世界。这里光靠下一个 token 不够。

BBC 文章里有一个很直观的例子。LeCun 竖起一支笔,问松手后会发生什么。小孩都知道笔会倒,但没人能精确预测它往哪个方向倒。对现实智能来说,重要的是知道“会倒”和“不必猜具体方向”;对只会统计下一个输出的系统来说,它可能试图给出一个看似合理但并不可靠的单点预测。

OC 原创解释图:LLM 的 token 预测和 JEPA / 世界模型的物理预测区别

JEPA 的想法是把现实场景压缩成有用的抽象表示,过滤掉没必要预测的细节,只保留和行动相关的信息。说白了,它不是让 AI 记住更多文本,而是让 AI 学会“这个世界哪些变化重要,哪些变化不用管”。这对机器人、工业控制、自动驾驶和复杂规划都更关键。

这也是为什么“世界模型”这个方向重新变热。牛津大学 Ingmar Posner 的团队、DeepMind 的 Genie、Wayve 的 Gaia、Fei-Fei Li 的 World Labs,都在类似问题上投入。大家不一定同意 LeCun 对 LLM 的批评有多重,但很多人承认,如果 AI 要进入物理世界,必须有比文本预测更强的状态理解和未来模拟能力。

林岚看这条新闻,会先把期待降一档。JEPA 和世界模型不是明天就能替代 LLM 的产品路线。它们更像补课:LLM 解决了语言接口和知识调用,世界模型要解决感知、因果、物理和行动后果。真正有用的系统,未来很可能是两者组合,而不是谁把谁彻底淘汰。

对开发者来说,短期影响不是“换模型”,而是判断应用场景。你做客服、写作、代码辅助、文档检索,LLM 仍然是最现实的工具;你做机器人、工业异常预测、模拟环境、自动驾驶,单纯把 LLM 接到传感器上就很危险。Demo 很好,SDK 呢?错误处理呢?现实世界里,一个错误动作可能不是回答错一句话,而是撞坏设备或伤到人。

本站的判断是,LeCun 这条路线的重要性在于提醒行业:智能不等于语言流畅。LLM 让机器更会说话,但下一阶段真正难的,是让机器知道自己身处什么世界、行动会造成什么后果、哪些不确定性应该保留。AI 如果要从屏幕走向工厂和家庭,现实感会比口才更重要。

参考来源

相关阅读

基于标题、摘要和正文内容自动匹配。

更多科技

评论

围绕这篇文章补充信息、提出问题或分享观察。

0
暂无评论。

发表评论