桃子桃子快讯
返回首页
行业动态

LeCun 批评 LLM「不聪明」,押注世界模型路线

Yann LeCun 离开 Meta 后创办 AMI Labs,融资超 10 亿美元,主推 JEPA 世界模型,否定 L…

2026.07.03 · 周五4 分钟阅读

Yann LeCun——深度学习先驱、Meta 前首席 AI 科学家——在 2025 年离开 Meta,创办了位于巴黎的 Advanced Machine Intelligence Labs(AMI Labs)。该公司近日宣布完成超过 10 亿美元(约合 7.6 亿英镑)的种子轮融资,投资方包括英伟达以及管理贝索斯个人财富的基金,是欧洲迄今规模最大的种子轮之一。LeCun 在法国 VivaTech 大会期间接受采访时,将当前主流的大语言模型(LLM)明确排除在通往人类级智能的路径之外。

LLM「很会背,但不够聪明」

LeCun 认为,以 ChatGPT、Claude、Gemini 为代表的 LLM 在编码、数学与文本生成等「定义明确、可预测」的任务上表现优秀,但它们本质上是知识的统计性「反刍」,缺乏对物理世界的理解能力。他举了一个例子:把一支笔竖立在桌面,松手后即便两三岁的小孩也知道笔会倒下,但无法预测倒向哪个方向;LLM 却会基于训练数据中的统计模式,给出单一、几乎必然错误的「方向预测」。

「它们不是通往人类级、类人级甚至类动物级智能的路径,因为它们无法处理真实世界数据,天生就不是为这个目标设计的,」LeCun 表示。「LLM 在机器人领域基本是毫无希望的。仅靠堆规模就达到超人类智能,这种说法根本不会发生。」

JEPA:让 AI 学会「抽象」真实世界

AMI Labs 正在研发的新系统名为 Joint Embedding Predictive Architecture(JEPA)。LeCun 描述其核心思路是:让 AI 对真实世界建立抽象表征,从而评估某个动作的可能结果。在上述「笔倒下」的例子中,JEPA 会意识到「倒向哪个方向」本身没有预测价值,从而避免强行输出错误答案。

学术界押注「世界模型」

LeCun 的观点并非孤例。牛津大学应用 AI 实验室负责人 Ingmar Posner 认为,未来十年 AI 的关键在于能解释因果、能反事实推理的系统。他正在带领约 10 名研究人员开发「机制型世界模型」(mechanistic world model),将知识按结构化方式组织,便于 AI 按需检索、组合与修改。

世界模型概念已存在数十年。2018 年 David Ha 与 Jürgen Schmidhuber 发表的论文奠定了基于「mental simulation」的学习范式,随后催生了大量相关研究:

  • Google 的 Dreamer 系列世界模型,去年通过「想象」未来场景,在《我的世界》(Minecraft)中自主完成收集钻石的任务。
  • DeepMind(Alphabet 旗下)发布的 Genie 模型。
  • 总部位于伦敦的 Wayve,其系统名为 Gaia。
  • 斯坦福教授李飞飞 2023 年在旧金山创立的 World Labs,同样瞄准空间智能与世界模型方向。

现实挑战

世界模型能否、以及何时能取代 LLM 成为通用智能的主流路线,仍是未知数。Posner 提醒:「如果 2017 或 2018 年你问任何专家 ChatGPT 这类东西什么时候出现,回答都会是『几十年以后还要再干几十年』。」而眼下,更紧迫的现实任务是让机器人在家庭场景中安全完成熨衣服、装洗碗机等操作——这正是当前 LLM 路线最薄弱的领域。

信源