桃子桃子 AI 快讯
返回首页
研究论文

Graph-RAG 还是无图多跳 RAG?社区基准测试引发讨论

社区用户对比图谱与无图多跳 RAG,无图方案在三个基准上胜出,且无需 GPU 与图谱重建。

2026.06.30 · 周二3 分钟阅读

近日,Reddit r/LocalLLaMA 社区用户分享了一组多跳 RAG 方案的基准测试结果:其自研的无图(graph-free)方案 MOTHRAG 在三个主流多跳问答数据集上均超过了 GraphRAG、HippoRAG 和 RAPTOR 等基于知识图谱的方案,且单次查询成本约 0.03 美元、无需 GPU。这一结论对「多跳 RAG 必须依赖知识图谱」的常见假设提出了挑战。

测试背景:图谱的重建成本

作者在实践中发现,多跳问答准确率最高的方案(GraphRAG、HippoRAG、RAPTOR)都依赖离线构建的知识图谱。虽然图谱在静态数据上效果良好,但每当数据更新(例如价格、财报、工单、新闻等日更内容),就需要重新运行 LLM 索引流程来重建图谱,代价高昂。

为验证图谱是否真正必要,作者设计了 MOTHRAG——一种基于稠密索引、在查询阶段做编排的方案,不使用知识图谱,也不依赖 GPU,所有组件均通过通用 API 调用。

基准结果:MOTHRAG 全面领先图谱方案

在三组多跳问答基准上,MOTHRAG 的得分均高于三个图谱基线:

  • HotpotQA:MOTHRAG 78.1 vs GraphRAG 68.6 / HippoRAG 75.5 / RAPTOR 69.5
  • 2WikiMultiHopQA:MOTHRAG 76.3 vs 58.6 / 71.0 / 52.1
  • MuSiQue:MOTHRAG 50.5 vs 38.5 / 48.6 / 28.9

在数据更新方面,MOTHRAG 只需对新文档执行 embed-and-append,无需重建图谱或重训模型。单次查询成本约 0.03 美元,整条链路无 GPU。

对比 GPU 方案:MuSiQue 仍是短板

在采用约束解码的 GPU 方案 NeocorRAG 面前,MOTHRAG 在 HotpotQA(78.1 vs 78.3)与 2WikiMultiHopQA(76.3 vs 76.1)上基本打平,但在 MuSiQue 上以 50.5 落后于 52.6。作者坦承,MuSiQue 上的检索召回仍是 MOTHRAG 的短板,尚未解决。

结论与社区讨论

作者的结论是:在数据频繁变化的场景下,知识图谱带来的主要代价是持续的重建成本,而非准确率提升;一个无图稠密索引配合良好的查询编排即可胜任多数多跳问答任务。该帖在 r/LocalLLaMA 引发讨论:在数据频繁变化的情况下,图谱的重建成本是否值得?

需要指出的是,这是社区实验性结果,尚未经过同行评审或独立复现,方法细节与超参选择也未完整披露,读者在参考时应保持审慎。

信源