Graph-RAG 还是无图多跳 RAG？社区基准测试引发讨论

近日，Reddit r/LocalLLaMA 社区用户分享了一组多跳 RAG 方案的基准测试结果：其自研的无图（graph-free）方案 MOTHRAG 在三个主流多跳问答数据集上均超过了 GraphRAG、HippoRAG 和 RAPTOR 等基于知识图谱的方案，且单次查询成本约 0.03 美元、无需 GPU。这一结论对「多跳 RAG 必须依赖知识图谱」的常见假设提出了挑战。

测试背景：图谱的重建成本

作者在实践中发现，多跳问答准确率最高的方案（GraphRAG、HippoRAG、RAPTOR）都依赖离线构建的知识图谱。虽然图谱在静态数据上效果良好，但每当数据更新（例如价格、财报、工单、新闻等日更内容），就需要重新运行 LLM 索引流程来重建图谱，代价高昂。

为验证图谱是否真正必要，作者设计了 MOTHRAG——一种基于稠密索引、在查询阶段做编排的方案，不使用知识图谱，也不依赖 GPU，所有组件均通过通用 API 调用。

基准结果：MOTHRAG 全面领先图谱方案

在三组多跳问答基准上，MOTHRAG 的得分均高于三个图谱基线：

HotpotQA：MOTHRAG 78.1 vs GraphRAG 68.6 / HippoRAG 75.5 / RAPTOR 69.5
2WikiMultiHopQA：MOTHRAG 76.3 vs 58.6 / 71.0 / 52.1
MuSiQue：MOTHRAG 50.5 vs 38.5 / 48.6 / 28.9

在数据更新方面，MOTHRAG 只需对新文档执行 embed-and-append，无需重建图谱或重训模型。单次查询成本约 0.03 美元，整条链路无 GPU。

对比 GPU 方案：MuSiQue 仍是短板

在采用约束解码的 GPU 方案 NeocorRAG 面前，MOTHRAG 在 HotpotQA（78.1 vs 78.3）与 2WikiMultiHopQA（76.3 vs 76.1）上基本打平，但在 MuSiQue 上以 50.5 落后于 52.6。作者坦承，MuSiQue 上的检索召回仍是 MOTHRAG 的短板，尚未解决。

结论与社区讨论

作者的结论是：在数据频繁变化的场景下，知识图谱带来的主要代价是持续的重建成本，而非准确率提升；一个无图稠密索引配合良好的查询编排即可胜任多数多跳问答任务。该帖在 r/LocalLLaMA 引发讨论：在数据频繁变化的情况下，图谱的重建成本是否值得？

需要指出的是，这是社区实验性结果，尚未经过同行评审或独立复现，方法细节与超参选择也未完整披露，读者在参考时应保持审慎。