GILP：用参数化世界模型降低 LLM 智能体幻觉传播

近日发表于 arXiv 的一项研究提出了一种名为 Grounded Iterative Language Planning（GILP）的新框架，旨在缓解大语言模型（LLM）智能体在多步规划任务中的幻觉传播问题。该方法通过将一个轻量化的参数化世界模型与基于 API 的智能体推理相组合，在保持语言模型灵活性的同时，利用结构化预测对幻觉进行显式校验。

研究背景：两类世界模型的取舍

研究首先系统比较了两类用于语言智能体的世界模型：

智能体型世界模型：直接调用 LLM API 并以自然语言进行推理，灵活度高，但错误表现为难以用普通回归损失打分的状态幻觉。
参数化世界模型：作为训练好的状态转移预测器，错误可用 NodeMSE、delta accuracy、validity accuracy 等指标量化，但作为独立规划器时能力通常较弱。

研究在四个图结构规划基准上对两类模型进行了对比，并针对智能体类型引入了「操作型幻觉指标」，用以衡量幻觉状态在多步推理中的传播情况。

GILP 的设计思路

基于上述比较，作者提出 GILP，仅训练一个小型参数化骨干网络，并将其与 API 智能体推理结合：

参数化骨干负责输出有效动作、预测的状态增量、风险估计与价值估计；
LLM 负责起草动作与「想象中的」状态增量；
一致性门控（consistency gate）在两者不一致时要求 LLM 修订，从而阻断幻觉向后续步骤扩散。

这种「轻量结构化预测 + 语言推理 + 显式校验」的三段式设计，使系统同时具备参数化模型的稳定性与 LLM 的语言泛化能力。

实验结果

在以真实 GPT-4o-mini 调用作为后端的测试中：

幻觉状态率由 0.176 降至 0.035，降幅约 80%；
在经过校准的模拟器消融实验中，任务成功率由 0.668 提升至 0.838；
上述收益仅带来约 22% 的额外 LLM 调用，计算开销可控。

意义与局限

GILP 为构建可靠的 LLM 智能体提供了一条务实的工程路径：通过引入可量化的世界模型与一致性门控，将幻觉从不可观测的推理噪声转化为可被检测与纠正的结构化信号。不过，该方法的当前评估集中在图结构规划任务上，是否能在更开放的环境（如网页导航、工具调用）中保持同样的幻觉抑制效果，仍有待后续工作验证。论文以预印本形式发布于 arXiv cs.AI，编号 2606.27806v1。