桃子桃子 AI 快讯
返回首页
开源

role-model:面向能力感知的 AI 路由开源协议

role-model 是以角色、任务与能力元数据驱动的开源 AI 路由协议与参考运行时,强调路由决策可解释、可审计。

2026.06.29 · 周一3 分钟阅读评分 47
评分细项加权总分 47
重要性
42
新颖性
55
影响面
35
可信度
58
实质性
55

role-model 是一款面向 AI 推理流量的开源路由协议与参考运行时,主打「按能力路由」而非「按模型名路由」。它试图把多模型调度从硬编码模型名或简单成本规则的层面,升级为可解释、可审计、可移植的结构化决策流程。

核心思路

role-model 把路由拆成若干稳定组件:请求意图、角色与任务定义、端点身份与画像、路由策略以及可观测性产物。路由器不再把「GPT-4o」「Claude」「本地 Qwen」视为抽象名字,而是把每个具体可调用的端点连同其能力、模态、工具、本地化、预算等元数据一起纳入打分。这样一来,跨供应商、跨主机、跨部署形态的路由逻辑可以保持一致,决策事后也能被回溯。

路由流程

参考实现按固定流程给出确定性较高的决策:

  • 归一化请求意图:合并请求与角色、任务元数据,形成有效策略快照。
  • 缩小候选集:只保留与角色、任务、策略范围匹配的端点。
  • 硬性资格校验:剔除在能力、模态、工具、本地化、预算或绑定方面不达标的端点。
  • 多维打分:综合质量、延迟、吞吐、成本、可靠性与偏好,优先采用实测数据,其次采用声明数据,缺省走中性默认值。
  • 输出可解释决策:返回 RouterDecision,包含选中端点、回退、排除项与选择理由。

这套流程确保每次路由都可以在事后被审计,而不是依赖黑盒猜测。

角色基线

role-model 内置了一组基线角色,覆盖常见任务类型:

  • general.chat:通用对话回复
  • coder.patch:以补丁为导向的代码编辑
  • coder.review:代码评审、批评与结构化裁决
  • tool.agent:工具调用与编排
  • embedder:检索与向量生成
  • classifier:分类与标签
  • language.detector:语种识别

每个角色绑定到具体任务类型和所需能力,便于在不同模型间复用同一套调度策略。

首次使用流程

参考实现的推荐顺序是:先安装并启动运行时,再连接本地或远端端点,激活模型并分配角色,然后对真实候选集跑全量基准、查看结果,再在证据基础上选择并保存路由策略(均衡、质量、延迟或成本),最后发起一次真实路由请求并查看决策细节。

下游客户端(如 Pi)通过 OpenAI 发现契约读取 role-model 别名,无需重复配置运行时。整体设计强调「先有证据、再定策略」,适合需要在多供应商、多部署形态间统一路由逻辑的工程团队。

不过,目前该项目仍以协议规范和参考实现为主,缺少公开的基准成绩、采用规模与生产案例,其实际效果与生态成熟度尚有待进一步观察。

信源