Claude Code 使用技巧：让主模型自主委派子代理以节省 token

知名 AI 博主 Simon Willison 在其个人博客中分享了一条来自 Anthropic Claude Code 团队的使用建议：在 Claude Code 中，与其逐条指定模型的工作方式，不如让模型按自身判断来决策，特别是在测试覆盖范围与是否调用子模型这类问题上。这条建议来自他在 AIE 大会上与 Claude Code 团队成员 Cat Wu、Thariq Shihipar 的炉边对谈。

来自 Anthropic 团队的建议：放手让模型做判断

在与 Simon 的交流中，Claude Code 团队以「测试」为例做了说明。用户可以明确要求「仅在较大功能改动时使用自动化测试，小的文案或设计变更不要更新和运行测试」，但更好的做法是直接告诉 Claude Code「按你自己的判断决定是否编写测试」。

类似的逻辑也适用于模型选择。Jesse Vincent 给 Simon 的补充建议是：在 Fable 价格即将上调前，可以通过提示让模型自行决定哪些任务交给更低规格的模型处理，从而减少对高价模型 token 的消耗。

实操示例：一条 prompt 与生成的记忆文件

Simon 在自己的项目中向 Claude Code 输入了如下指令：

对于所有编码任务，使用你的判断来决定一个合适的低功耗模型，并在子代理中运行它。

Claude Code 随后在 ~/.claude/projects/name-of-project/memory/ 目录下自动保存了一份记忆文件 delegate-coding-to-subagents.md。文件内容概要如下：

名称：delegate-coding-to-subagents
类型：feedback（用户反馈）
原话摘录：用户于 2026-07-03 提出「对于所有编码任务，使用你的判断来决定一个合适的低功耗模型，并在子代理中运行它。」
适用原因：出于成本与效率考虑，具体的实现工作通常不需要顶级模型；判断、审查与综合工作仍由主模型负责。
适用方式：对于以代码编写或编辑为主的任务，主模型派生一个 Agent，通过模型覆写使用更低规格的子模型（实质性实现用 sonnet，琐碎或机械性修改用 haiku），并在主循环中审阅后再提交；涉及设计、审计、数据综合以及任何依赖判断的工作仍保留在主模型中。

实际效果

Simon 表示，这条规则目前运行良好。他完成了大量工作，Fable 的可用额度也比之前消耗得更慢。该机制的核心思路是把「是否调用子模型、用哪个模型」这类决策权交给主模型自身，由其根据任务复杂度动态分配算力，从而在高强度编码场景下兼顾效果与成本。

需要注意的是，这篇文章的核心内容仍是个人使用经验与提示工程技巧，而非新模型发布或重大功能更新。其价值更多体现在具体的 prompt 写法与 Claude Code 记忆机制的实际样例上。