桃子桃子快讯
返回首页
开源

SupraLabs 开源 Supra-Router-51M:51M 参数的轻量提示路由模型

SupraLabs 发布仅 51M 参数的提示路由模型,可根据用户请求将任务分配给不同规模的模型,并同步开源了训练数据集…

2026.07.06 · 周一2 分钟阅读

SupraLabs 在 Hugging Face Hub 上开源了 Supra-Router-51M,一个仅 51M 参数的轻量级提示路由(prompt routing)模型。该模型的核心定位是「编排器」:根据用户输入的提示词与请求内容,自动判断应该将请求转发给小型模型还是大型模型处理,从而在响应质量与推理成本之间取得平衡。

模型特点

Supra-Router-51M 的主打卖点是极小体积带来的低延迟优势:

  • 参数规模仅 51M,适合在低延迟环境中部署;
  • 设计目标是请求路由,而非直接回答用户问题;
  • 可作为多模型系统中的前置调度层,在本地小模型与云端大模型之间做分流。

SupraLabs 表示,该模型在实际样例中可以根据请求复杂度,将简单查询路由到轻量模型、复杂任务路由到更强的模型,从而帮助开发者在不显著牺牲体验的前提下降低推理开销。

开源资源

SupraLabs 在发布模型的同时,也一并公开了训练数据:

社区可直接下载模型与数据集进行复现、微调或二次开发。

适用场景与局限

从功能定位来看,Supra-Router-51M 适合以下场景:

  • 需要在同一套接口下混合调用多个不同规模模型的应用;
  • 对首 token 延迟敏感、但又希望在复杂请求上调用更强模型的边缘或本地部署方案;
  • 希望以极低成本引入路由层的实验性项目。

需要指出的是,SupraLabs 目前并非主流 AI 厂商,官方公布的技术细节有限,缺少基准测试(benchmark)数据、训练方法说明以及与现有路由方案(如 Martian、Not Diamond 等)的对比。因此该模型更适合作为社区实验样本,实际生产环境中的稳定性与准确性仍需开发者自行验证。

信源