Kilo 上线 Auto Efficient:按任务自动匹配编码模型
AI 编码助手 Kilo 新增 Auto Efficient 路由模式,基于自有基准实时为每次请求挑选性价比最优的模型。
- 重要性
- 32
- 新颖性
- 35
- 影响面
- 25
- 可信度
- 55
- 实质性
- 45
AI 编码助手 Kilo 近日在其 Auto Model 体系中新增了一个名为「Auto Efficient」的路由模式。该模式会在每一次请求时,根据任务类型与难度自动从模型池中挑选最合适的模型,既不强制用户锁定单一模型,也不要求手动切换档位。
核心机制:按任务实时路由
Auto Efficient 的核心是一个轻量级分类器。它会读取当前会话上下文,判断任务类型与难度,然后在经过基准验证的候选模型池中匹配「准确性达标、价格最低」的选项,并把请求路由过去。整个决策发生在用户两次按键之间:简单的变量重命名会落在快速廉价的模型上,规划一次复杂的迁移方案则会被路由到更强的模型——全程无需用户在界面中切换模式。
路由依据:KiloBench 公开基准
Auto Efficient 的选择不依赖模型厂商的市场宣传,而是基于 Kilo 自有的 KiloBench 编码基准。KiloBench 由 Kilo 平台上开发者实际产生的任务构成,会持续对模型池中的候选进行打分,相关排行公开在 Kilo Leaderboard 上,任何人都可以查阅。换句话说,当路由把任务交给一个更便宜的模型时,是因为该模型在这类工作上的表现已被证明与更贵的选项相当。用户如果更愿意手动决策,也可以直接在排行榜中找到对应任务类型下表现达标的最便宜模型,自己挑选。
会话感知与质量兜底
为了避免逐请求切换模型导致的上下文断裂、自相矛盾等问题,Auto Efficient 采用了会话感知策略:一旦某条对话线确定了一个合适的模型,它会在相关回合中保持不变,只在出现明显更优的更低成本选项时才切换。
此外,当分类器无法确定请求应匹配哪个模型时,系统会回退到 Balanced 档,由一个付费的可靠模型兜底,确保质量不会跌破 Balanced 这一底线。
两档策略与手动覆盖
用户可以在仪表盘中选择两档倾向:
- 成本优先:在准确性达标的前提下,选用最便宜的模型;
- 质量优先:在候选池中选用表现最强的已验证模型。
可根据项目对成本或质量的敏感度做取舍,再让路由自动执行。如果不想使用自动路由,用户也可以随时手动指定模型、接入自有的 API Key,或者通过 Ollama、LM Studio 等接入本地模型。
版本要求
要使用 Auto Efficient 的自动模式切换功能,需要将 Kilo 的 VS Code 或 JetBrains 插件升级到 v5.2.3 及以上,或将 CLI 升级到 v1.0.15 及以上。旧版本在该档位下会回退为所有请求都路由到同一个模型,无法享受逐请求的动态路由收益。
