桃子桃子 AI 快讯
返回首页
开源

开源多跳 RAG 框架 MOTHRAG:跳过知识图谱

无需图谱与 GPU,HotpotQA 等多跳问答基准上整体超越主流图谱方法,单次查询成本约 0.03 美元。

2026.07.01 · 周三3 分钟阅读

多跳问答一直是 RAG 系统的难点之一,而当前表现较好的方案几乎都依赖离线构建的知识图谱。Reddit 用户近日开源了 MOTHRAG,提出了一种「无图谱、查询时编排」的替代路线,在 HotpotQA、2WikiMultiHopQA、MuSiQue 三个多跳问答基准上整体超过了 GraphRAG、HippoRAG、RAPTOR 等主流图谱方案,且全程不需要 GPU。

核心思路:放弃离线图谱,改在查询时编排

构建多跳 RAG 时,作者反复遇到同一个问题:GraphRAG、HippoRAG、RAPTOR 等高精度方案都依赖离线构建的知识图谱,数据一旦变化,就需要用 LLM 跑一次昂贵的重建索引流程。对于价格表、内部文档、工单、新闻等每天都在更新的语料来说,这笔「重建账单」几乎无法承受。

MOTHRAG 的做法是用一个「无图谱的稠密索引」加「查询时编排」来替代:

  • 不构建知识图谱,不需要 GPU;
  • 所有组件都可调用通用 API;
  • 数据更新只需「嵌入并追加」,无需重建、无需重训。

基准测试结果:三项多跳任务上整体领先

作者在三个常用多跳问答基准上对比了 MOTHRAG 与三种主流图谱方法的 Accuracy / F1(数值越接近 100 越好):

  • HotpotQA:MOTHRAG 78.1,GraphRAG 68.6,HippoRAG 75.5,RAPTOR 69.5;
  • 2WikiMultiHop:MOTHRAG 76.3,GraphRAG 58.6,HippoRAG 71.0,RAPTOR 52.1;
  • MuSiQue:MOTHRAG 50.5,GraphRAG 38.5,HippoRAG 48.6,RAPTOR 28.9。

从数据可以看到,MOTHRAG 在三项任务上均超过 GraphRAG 与 RAPTOR,在 2WikiMultiHop 上对 HippoRAG 也有约 5 个百分点的优势。

与 GPU 方案的对比:MuSiQue 仍是短板

作者也把自己和需要 GPU 并使用约束解码的 NeocorRAG 做了对比:

  • HotpotQA:78.1 vs 78.3,几乎持平;
  • 2WikiMultiHop:76.3 vs 76.1,几乎持平;
  • MuSiQue:50.5 vs 52.6,略输。

作者坦承,MuSiQue 是目前最明显的短板,问题出在检索召回率上,尚未解决。

部署与成本

MOTHRAG 采用 Apache-2.0 协议,可通过标准 pip 安装 + 配置 API key 即可运行,单次查询成本约 0.03 美元,且整条链路无 GPU 依赖。作者表示,对于「语料频繁变化、且需要多跳推理」的场景,图谱带来的更多是重建开销,而不是准确率本身。

信源