开源
SupraLabs 开源 Supra-Router-51M:51M 参数的轻量提示路由模型
SupraLabs 发布仅 51M 参数的提示路由模型,可根据用户请求将任务分配给不同规模的模型,并同步开源了训练数据集…
2026.07.06 · 周一约 2 分钟阅读
SupraLabs 在 Hugging Face Hub 上开源了 Supra-Router-51M,一个仅 51M 参数的轻量级提示路由(prompt routing)模型。该模型的核心定位是「编排器」:根据用户输入的提示词与请求内容,自动判断应该将请求转发给小型模型还是大型模型处理,从而在响应质量与推理成本之间取得平衡。
模型特点
Supra-Router-51M 的主打卖点是极小体积带来的低延迟优势:
- 参数规模仅 51M,适合在低延迟环境中部署;
- 设计目标是请求路由,而非直接回答用户问题;
- 可作为多模型系统中的前置调度层,在本地小模型与云端大模型之间做分流。
SupraLabs 表示,该模型在实际样例中可以根据请求复杂度,将简单查询路由到轻量模型、复杂任务路由到更强的模型,从而帮助开发者在不显著牺牲体验的前提下降低推理开销。
开源资源
SupraLabs 在发布模型的同时,也一并公开了训练数据:
社区可直接下载模型与数据集进行复现、微调或二次开发。
适用场景与局限
从功能定位来看,Supra-Router-51M 适合以下场景:
- 需要在同一套接口下混合调用多个不同规模模型的应用;
- 对首 token 延迟敏感、但又希望在复杂请求上调用更强模型的边缘或本地部署方案;
- 希望以极低成本引入路由层的实验性项目。
需要指出的是,SupraLabs 目前并非主流 AI 厂商,官方公布的技术细节有限,缺少基准测试(benchmark)数据、训练方法说明以及与现有路由方案(如 Martian、Not Diamond 等)的对比。因此该模型更适合作为社区实验样本,实际生产环境中的稳定性与准确性仍需开发者自行验证。
