研究论文
GILP:用参数化世界模型降低 LLM 智能体幻觉传播
arXiv 新论文提出 GILP 框架,将小型参数化世界模型与 API 智能体推理结合,通过一致性门控将幻觉状态率从 0…
2026.06.29 · 周一约 3 分钟阅读评分 59
评分细项加权总分 59
- 重要性
- 55
- 新颖性
- 62
- 影响面
- 45
- 可信度
- 76
- 实质性
- 72
近日发表于 arXiv 的一项研究提出了一种名为 Grounded Iterative Language Planning(GILP)的新框架,旨在缓解大语言模型(LLM)智能体在多步规划任务中的幻觉传播问题。该方法通过将一个轻量化的参数化世界模型与基于 API 的智能体推理相组合,在保持语言模型灵活性的同时,利用结构化预测对幻觉进行显式校验。
研究背景:两类世界模型的取舍
研究首先系统比较了两类用于语言智能体的世界模型:
- 智能体型世界模型:直接调用 LLM API 并以自然语言进行推理,灵活度高,但错误表现为难以用普通回归损失打分的状态幻觉。
- 参数化世界模型:作为训练好的状态转移预测器,错误可用 NodeMSE、delta accuracy、validity accuracy 等指标量化,但作为独立规划器时能力通常较弱。
研究在四个图结构规划基准上对两类模型进行了对比,并针对智能体类型引入了「操作型幻觉指标」,用以衡量幻觉状态在多步推理中的传播情况。
GILP 的设计思路
基于上述比较,作者提出 GILP,仅训练一个小型参数化骨干网络,并将其与 API 智能体推理结合:
- 参数化骨干负责输出有效动作、预测的状态增量、风险估计与价值估计;
- LLM 负责起草动作与「想象中的」状态增量;
- 一致性门控(consistency gate)在两者不一致时要求 LLM 修订,从而阻断幻觉向后续步骤扩散。
这种「轻量结构化预测 + 语言推理 + 显式校验」的三段式设计,使系统同时具备参数化模型的稳定性与 LLM 的语言泛化能力。
实验结果
在以真实 GPT-4o-mini 调用作为后端的测试中:
- 幻觉状态率由 0.176 降至 0.035,降幅约 80%;
- 在经过校准的模拟器消融实验中,任务成功率由 0.668 提升至 0.838;
- 上述收益仅带来约 22% 的额外 LLM 调用,计算开销可控。
意义与局限
GILP 为构建可靠的 LLM 智能体提供了一条务实的工程路径:通过引入可量化的世界模型与一致性门控,将幻觉从不可观测的推理噪声转化为可被检测与纠正的结构化信号。不过,该方法的当前评估集中在图结构规划任务上,是否能在更开放的环境(如网页导航、工具调用)中保持同样的幻觉抑制效果,仍有待后续工作验证。论文以预印本形式发布于 arXiv cs.AI,编号 2606.27806v1。
