开源
role-model:面向能力感知的 AI 路由开源协议
role-model 是以角色、任务与能力元数据驱动的开源 AI 路由协议与参考运行时,强调路由决策可解释、可审计。
2026.06.29 · 周一约 3 分钟阅读评分 47
评分细项加权总分 47
- 重要性
- 42
- 新颖性
- 55
- 影响面
- 35
- 可信度
- 58
- 实质性
- 55
role-model 是一款面向 AI 推理流量的开源路由协议与参考运行时,主打「按能力路由」而非「按模型名路由」。它试图把多模型调度从硬编码模型名或简单成本规则的层面,升级为可解释、可审计、可移植的结构化决策流程。
核心思路
role-model 把路由拆成若干稳定组件:请求意图、角色与任务定义、端点身份与画像、路由策略以及可观测性产物。路由器不再把「GPT-4o」「Claude」「本地 Qwen」视为抽象名字,而是把每个具体可调用的端点连同其能力、模态、工具、本地化、预算等元数据一起纳入打分。这样一来,跨供应商、跨主机、跨部署形态的路由逻辑可以保持一致,决策事后也能被回溯。
路由流程
参考实现按固定流程给出确定性较高的决策:
- 归一化请求意图:合并请求与角色、任务元数据,形成有效策略快照。
- 缩小候选集:只保留与角色、任务、策略范围匹配的端点。
- 硬性资格校验:剔除在能力、模态、工具、本地化、预算或绑定方面不达标的端点。
- 多维打分:综合质量、延迟、吞吐、成本、可靠性与偏好,优先采用实测数据,其次采用声明数据,缺省走中性默认值。
- 输出可解释决策:返回 RouterDecision,包含选中端点、回退、排除项与选择理由。
这套流程确保每次路由都可以在事后被审计,而不是依赖黑盒猜测。
角色基线
role-model 内置了一组基线角色,覆盖常见任务类型:
- general.chat:通用对话回复
- coder.patch:以补丁为导向的代码编辑
- coder.review:代码评审、批评与结构化裁决
- tool.agent:工具调用与编排
- embedder:检索与向量生成
- classifier:分类与标签
- language.detector:语种识别
每个角色绑定到具体任务类型和所需能力,便于在不同模型间复用同一套调度策略。
首次使用流程
参考实现的推荐顺序是:先安装并启动运行时,再连接本地或远端端点,激活模型并分配角色,然后对真实候选集跑全量基准、查看结果,再在证据基础上选择并保存路由策略(均衡、质量、延迟或成本),最后发起一次真实路由请求并查看决策细节。
下游客户端(如 Pi)通过 OpenAI 发现契约读取 role-model 别名,无需重复配置运行时。整体设计强调「先有证据、再定策略」,适合需要在多供应商、多部署形态间统一路由逻辑的工程团队。
不过,目前该项目仍以协议规范和参考实现为主,缺少公开的基准成绩、采用规模与生产案例,其实际效果与生态成熟度尚有待进一步观察。
