Claude Code 使用技巧:让主模型自主委派子代理以节省 token
Simon Willison 分享 Anthropic 团队建议,让 Claude Code 主模型按自身判断委派子代理…
知名 AI 博主 Simon Willison 在其个人博客中分享了一条来自 Anthropic Claude Code 团队的使用建议:在 Claude Code 中,与其逐条指定模型的工作方式,不如让模型按自身判断来决策,特别是在测试覆盖范围与是否调用子模型这类问题上。这条建议来自他在 AIE 大会上与 Claude Code 团队成员 Cat Wu、Thariq Shihipar 的炉边对谈。
来自 Anthropic 团队的建议:放手让模型做判断
在与 Simon 的交流中,Claude Code 团队以「测试」为例做了说明。用户可以明确要求「仅在较大功能改动时使用自动化测试,小的文案或设计变更不要更新和运行测试」,但更好的做法是直接告诉 Claude Code「按你自己的判断决定是否编写测试」。
类似的逻辑也适用于模型选择。Jesse Vincent 给 Simon 的补充建议是:在 Fable 价格即将上调前,可以通过提示让模型自行决定哪些任务交给更低规格的模型处理,从而减少对高价模型 token 的消耗。
实操示例:一条 prompt 与生成的记忆文件
Simon 在自己的项目中向 Claude Code 输入了如下指令:
- 对于所有编码任务,使用你的判断来决定一个合适的低功耗模型,并在子代理中运行它。
Claude Code 随后在 ~/.claude/projects/name-of-project/memory/ 目录下自动保存了一份记忆文件 delegate-coding-to-subagents.md。文件内容概要如下:
- 名称:
delegate-coding-to-subagents - 类型:
feedback(用户反馈) - 原话摘录:用户于 2026-07-03 提出「对于所有编码任务,使用你的判断来决定一个合适的低功耗模型,并在子代理中运行它。」
- 适用原因:出于成本与效率考虑,具体的实现工作通常不需要顶级模型;判断、审查与综合工作仍由主模型负责。
- 适用方式:对于以代码编写或编辑为主的任务,主模型派生一个 Agent,通过模型覆写使用更低规格的子模型(实质性实现用 sonnet,琐碎或机械性修改用 haiku),并在主循环中审阅后再提交;涉及设计、审计、数据综合以及任何依赖判断的工作仍保留在主模型中。
实际效果
Simon 表示,这条规则目前运行良好。他完成了大量工作,Fable 的可用额度也比之前消耗得更慢。该机制的核心思路是把「是否调用子模型、用哪个模型」这类决策权交给主模型自身,由其根据任务复杂度动态分配算力,从而在高强度编码场景下兼顾效果与成本。
需要注意的是,这篇文章的核心内容仍是个人使用经验与提示工程技巧,而非新模型发布或重大功能更新。其价值更多体现在具体的 prompt 写法与 Claude Code 记忆机制的实际样例上。
