Waymo 再度大规模召回，自动驾驶世界模型为何卡在施工道路？

6 月下旬，Waymo 宣布召回 3871 辆 Robotaxi，原因是部分车辆在高速道路行驶时可能未能识别封闭施工区，或错误地优先规避其他风险，导致车辆进入施工道路并继续高速行驶。这是 Waymo 近两年多次召回事件中的最新一起，距 5 月因无法规避积水区域而召回约 3800 辆车不到两个月。施工区、积水、道路封闭并非驾驶行业陌生场景，却仍让头部玩家大规模翻车，这不免让人重新审视世界模型与数据闭环在消化现实道路复杂性方面的真实能力。

召回不是「翻车实录」，而是规模化必经的考题

Waymo 的事故揭示了一个常被忽视的事实：现实道路的各类情况永远无法被模型训练尽数列举，而训练阶段已覆盖的场景，也可能在真实运营中与车速、车流、临时标志等现场条件重新组合，酿成新的失败。对自动驾驶来说，世界模型除了生成更复杂的长尾场景、模拟更真实的道路交互，如何从整体技术策略高度把现实道路已暴露的失败高效转化为新的训练、评估和修复资产，完成「失败闭环」，同样关键。一次误入、一次接管、一次召回，不应只是事故复盘中的孤立案例，而应成为模型生成、训练、评估和回灌的起点。

识别与筛选：消化失败的前哨战

真实场景暴露的问题往往不是单点故障，而是感知、预测、规划、风险排序等能力在复杂交通互动中的组合性失效。Cruise 曾因系统风险判断失误导致不恰当硬制动而召回近 1200 辆车；Zoox 的 Robotaxi 去年也因系统误判行驶轨迹召回 270 辆、因意外逆向停车再召回 332 辆。这些案例共同说明，Robotaxi 进入真实道路后，组合性失效才是常态。

清华大学封硕副教授与美国密歇根大学研究团队今年发布的最新研究指出，自动驾驶模型在部分训练场景中提升安全性的同时，可能在其他场景出现安全性退化的「跷跷板效应」，并据此提出「dense learning」方法，让模型自动筛选高价值数据样本并主动分层学习。失败样本并非越多越好，关键在于哪些失败值得学、如何组织、学完后是否制造了新副作用。

世界模型要打的是「硬仗」

香港大学李弘扬团队联合华为、清华大学的最新研究提出，自动驾驶模型应当进入「后训练」时代：从真实驾驶日志中发现安全关键场景，将其重建为可交互环境，再生成相似但不完全相同的交通变体，用于闭环评测和强化学习后训练。其设计的 World Engine 要回答的核心问题是：真实失败能否被迅速展开，形成模型可高效重新学习和验证的新场景。

一次施工区误入如果只停留在事故复盘中，它只是孤立事件；如果能被世界模型重建为不同车速、不同锥桶摆放、不同旁车行为下的一组场景，才可能成为一类可训练问题。国内玩家也在朝相近方向靠拢：Momenta 在 R7 强化学习世界模型中强调让智能驾驶进入「理解世界」阶段；蔚来、小鹏分别在世界模型、VLA 与闭环强化学习等方向加码；华为 Octopus 偏向云端端到端开发工具链，覆盖数据预处理、标注、训练、仿真到部署全流程。

商业层面：失败闭环能力决定扩张速度

每一次召回都不只是软硬件更新。路透社、CNBC、福克斯等主流媒体第一时间跟进报道，事故亲历者公开质疑技术安全性，一次意外事件就可能让企业运营范围收缩、扩张节奏中断、监管沟通成本骤增。更大的商业风险在于企业长期只能依赖「上路暴露问题—召回修复—重新投放—再暴露问题」的被动循环。

高风险行业并非没有参照。航空业早已建立围绕日常飞行数据、航行事件和一线报告的安全反馈机制，让运营中的异常和险情沉淀为训练、流程、维护和管制改进的一部分。自动驾驶同样面临这一转型需求：世界模型和仿真训练可以把真实失败重建成可交互、可变形、可反复评估的场景资产，从而降低下一次同类问题的处理成本。世界模型当然还要模拟更复杂的世界，但自动驾驶真正要证明的，是它能否从已经发生的失败里，尽快学会下一次不再失败。