LeCun 批评 LLM「不聪明」，押注世界模型路线

Yann LeCun——深度学习先驱、Meta 前首席 AI 科学家——在 2025 年离开 Meta，创办了位于巴黎的 Advanced Machine Intelligence Labs（AMI Labs）。该公司近日宣布完成超过 10 亿美元（约合 7.6 亿英镑）的种子轮融资，投资方包括英伟达以及管理贝索斯个人财富的基金，是欧洲迄今规模最大的种子轮之一。LeCun 在法国 VivaTech 大会期间接受采访时，将当前主流的大语言模型（LLM）明确排除在通往人类级智能的路径之外。

LLM「很会背，但不够聪明」

LeCun 认为，以 ChatGPT、Claude、Gemini 为代表的 LLM 在编码、数学与文本生成等「定义明确、可预测」的任务上表现优秀，但它们本质上是知识的统计性「反刍」，缺乏对物理世界的理解能力。他举了一个例子：把一支笔竖立在桌面，松手后即便两三岁的小孩也知道笔会倒下，但无法预测倒向哪个方向；LLM 却会基于训练数据中的统计模式，给出单一、几乎必然错误的「方向预测」。

「它们不是通往人类级、类人级甚至类动物级智能的路径，因为它们无法处理真实世界数据，天生就不是为这个目标设计的，」LeCun 表示。「LLM 在机器人领域基本是毫无希望的。仅靠堆规模就达到超人类智能，这种说法根本不会发生。」

JEPA：让 AI 学会「抽象」真实世界

AMI Labs 正在研发的新系统名为 Joint Embedding Predictive Architecture（JEPA）。LeCun 描述其核心思路是：让 AI 对真实世界建立抽象表征，从而评估某个动作的可能结果。在上述「笔倒下」的例子中，JEPA 会意识到「倒向哪个方向」本身没有预测价值，从而避免强行输出错误答案。

学术界押注「世界模型」

LeCun 的观点并非孤例。牛津大学应用 AI 实验室负责人 Ingmar Posner 认为，未来十年 AI 的关键在于能解释因果、能反事实推理的系统。他正在带领约 10 名研究人员开发「机制型世界模型」（mechanistic world model），将知识按结构化方式组织，便于 AI 按需检索、组合与修改。

世界模型概念已存在数十年。2018 年 David Ha 与 Jürgen Schmidhuber 发表的论文奠定了基于「mental simulation」的学习范式，随后催生了大量相关研究：

Google 的 Dreamer 系列世界模型，去年通过「想象」未来场景，在《我的世界》（Minecraft）中自主完成收集钻石的任务。
DeepMind（Alphabet 旗下）发布的 Genie 模型。
总部位于伦敦的 Wayve，其系统名为 Gaia。
斯坦福教授李飞飞 2023 年在旧金山创立的 World Labs，同样瞄准空间智能与世界模型方向。

现实挑战

世界模型能否、以及何时能取代 LLM 成为通用智能的主流路线，仍是未知数。Posner 提醒：「如果 2017 或 2018 年你问任何专家 ChatGPT 这类东西什么时候出现，回答都会是『几十年以后还要再干几十年』。」而眼下，更紧迫的现实任务是让机器人在家庭场景中安全完成熨衣服、装洗碗机等操作——这正是当前 LLM 路线最薄弱的领域。