桃子桃子 AI 快讯
返回首页
研究论文

GILP:用参数化世界模型降低 LLM 智能体幻觉传播

arXiv 新论文提出 GILP 框架,将小型参数化世界模型与 API 智能体推理结合,通过一致性门控将幻觉状态率从 0…

2026.06.29 · 周一3 分钟阅读评分 59
评分细项加权总分 59
重要性
55
新颖性
62
影响面
45
可信度
76
实质性
72

近日发表于 arXiv 的一项研究提出了一种名为 Grounded Iterative Language Planning(GILP)的新框架,旨在缓解大语言模型(LLM)智能体在多步规划任务中的幻觉传播问题。该方法通过将一个轻量化的参数化世界模型与基于 API 的智能体推理相组合,在保持语言模型灵活性的同时,利用结构化预测对幻觉进行显式校验。

研究背景:两类世界模型的取舍

研究首先系统比较了两类用于语言智能体的世界模型:

  • 智能体型世界模型:直接调用 LLM API 并以自然语言进行推理,灵活度高,但错误表现为难以用普通回归损失打分的状态幻觉。
  • 参数化世界模型:作为训练好的状态转移预测器,错误可用 NodeMSE、delta accuracy、validity accuracy 等指标量化,但作为独立规划器时能力通常较弱。

研究在四个图结构规划基准上对两类模型进行了对比,并针对智能体类型引入了「操作型幻觉指标」,用以衡量幻觉状态在多步推理中的传播情况。

GILP 的设计思路

基于上述比较,作者提出 GILP,仅训练一个小型参数化骨干网络,并将其与 API 智能体推理结合:

  • 参数化骨干负责输出有效动作、预测的状态增量、风险估计与价值估计;
  • LLM 负责起草动作与「想象中的」状态增量;
  • 一致性门控(consistency gate)在两者不一致时要求 LLM 修订,从而阻断幻觉向后续步骤扩散。

这种「轻量结构化预测 + 语言推理 + 显式校验」的三段式设计,使系统同时具备参数化模型的稳定性与 LLM 的语言泛化能力。

实验结果

在以真实 GPT-4o-mini 调用作为后端的测试中:

  • 幻觉状态率由 0.176 降至 0.035,降幅约 80%;
  • 在经过校准的模拟器消融实验中,任务成功率由 0.668 提升至 0.838
  • 上述收益仅带来约 22% 的额外 LLM 调用,计算开销可控。

意义与局限

GILP 为构建可靠的 LLM 智能体提供了一条务实的工程路径:通过引入可量化的世界模型与一致性门控,将幻觉从不可观测的推理噪声转化为可被检测与纠正的结构化信号。不过,该方法的当前评估集中在图结构规划任务上,是否能在更开放的环境(如网页导航、工具调用)中保持同样的幻觉抑制效果,仍有待后续工作验证。论文以预印本形式发布于 arXiv cs.AI,编号 2606.27806v1。

信源