Kilo 上线 Auto Efficient：按任务自动匹配编码模型

AI 编码助手 Kilo 近日在其 Auto Model 体系中新增了一个名为「Auto Efficient」的路由模式。该模式会在每一次请求时，根据任务类型与难度自动从模型池中挑选最合适的模型，既不强制用户锁定单一模型，也不要求手动切换档位。

核心机制：按任务实时路由

Auto Efficient 的核心是一个轻量级分类器。它会读取当前会话上下文，判断任务类型与难度，然后在经过基准验证的候选模型池中匹配「准确性达标、价格最低」的选项，并把请求路由过去。整个决策发生在用户两次按键之间：简单的变量重命名会落在快速廉价的模型上，规划一次复杂的迁移方案则会被路由到更强的模型——全程无需用户在界面中切换模式。

路由依据：KiloBench 公开基准

Auto Efficient 的选择不依赖模型厂商的市场宣传，而是基于 Kilo 自有的 KiloBench 编码基准。KiloBench 由 Kilo 平台上开发者实际产生的任务构成，会持续对模型池中的候选进行打分，相关排行公开在 Kilo Leaderboard 上，任何人都可以查阅。换句话说，当路由把任务交给一个更便宜的模型时，是因为该模型在这类工作上的表现已被证明与更贵的选项相当。用户如果更愿意手动决策，也可以直接在排行榜中找到对应任务类型下表现达标的最便宜模型，自己挑选。

会话感知与质量兜底

为了避免逐请求切换模型导致的上下文断裂、自相矛盾等问题，Auto Efficient 采用了会话感知策略：一旦某条对话线确定了一个合适的模型，它会在相关回合中保持不变，只在出现明显更优的更低成本选项时才切换。

此外，当分类器无法确定请求应匹配哪个模型时，系统会回退到 Balanced 档，由一个付费的可靠模型兜底，确保质量不会跌破 Balanced 这一底线。

两档策略与手动覆盖

用户可以在仪表盘中选择两档倾向：

成本优先：在准确性达标的前提下，选用最便宜的模型；
质量优先：在候选池中选用表现最强的已验证模型。

可根据项目对成本或质量的敏感度做取舍，再让路由自动执行。如果不想使用自动路由，用户也可以随时手动指定模型、接入自有的 API Key，或者通过 Ollama、LM Studio 等接入本地模型。

版本要求

要使用 Auto Efficient 的自动模式切换功能，需要将 Kilo 的 VS Code 或 JetBrains 插件升级到 v5.2.3 及以上，或将 CLI 升级到 v1.0.15 及以上。旧版本在该档位下会回退为所有请求都路由到同一个模型，无法享受逐请求的动态路由收益。