role-model：面向能力感知的 AI 路由开源协议

role-model 是一款面向 AI 推理流量的开源路由协议与参考运行时，主打「按能力路由」而非「按模型名路由」。它试图把多模型调度从硬编码模型名或简单成本规则的层面，升级为可解释、可审计、可移植的结构化决策流程。

核心思路

role-model 把路由拆成若干稳定组件：请求意图、角色与任务定义、端点身份与画像、路由策略以及可观测性产物。路由器不再把「GPT-4o」「Claude」「本地 Qwen」视为抽象名字，而是把每个具体可调用的端点连同其能力、模态、工具、本地化、预算等元数据一起纳入打分。这样一来，跨供应商、跨主机、跨部署形态的路由逻辑可以保持一致，决策事后也能被回溯。

路由流程

参考实现按固定流程给出确定性较高的决策：

归一化请求意图：合并请求与角色、任务元数据，形成有效策略快照。
缩小候选集：只保留与角色、任务、策略范围匹配的端点。
硬性资格校验：剔除在能力、模态、工具、本地化、预算或绑定方面不达标的端点。
多维打分：综合质量、延迟、吞吐、成本、可靠性与偏好，优先采用实测数据，其次采用声明数据，缺省走中性默认值。
输出可解释决策：返回 RouterDecision，包含选中端点、回退、排除项与选择理由。

这套流程确保每次路由都可以在事后被审计，而不是依赖黑盒猜测。

角色基线

role-model 内置了一组基线角色，覆盖常见任务类型：

general.chat：通用对话回复
coder.patch：以补丁为导向的代码编辑
coder.review：代码评审、批评与结构化裁决
tool.agent：工具调用与编排
embedder：检索与向量生成
classifier：分类与标签
language.detector：语种识别

每个角色绑定到具体任务类型和所需能力，便于在不同模型间复用同一套调度策略。

首次使用流程

参考实现的推荐顺序是：先安装并启动运行时，再连接本地或远端端点，激活模型并分配角色，然后对真实候选集跑全量基准、查看结果，再在证据基础上选择并保存路由策略（均衡、质量、延迟或成本），最后发起一次真实路由请求并查看决策细节。

下游客户端（如 Pi）通过 OpenAI 发现契约读取 role-model 别名，无需重复配置运行时。整体设计强调「先有证据、再定策略」，适合需要在多供应商、多部署形态间统一路由逻辑的工程团队。

不过，目前该项目仍以协议规范和参考实现为主，缺少公开的基准成绩、采用规模与生产案例，其实际效果与生态成熟度尚有待进一步观察。