Gartner 预警：AI 编程 token 支出两年内或追平开发者薪资

企业正在为开发者的 AI 编程 token 使用支付越来越高的费用。Gartner 高级首席分析师 Nitish Tyagi 预测，在未来两年内，部分企业的 AI 编程 token 月支出将追平甚至超过全球平均软件工程师月薪（约 2000 美元）。这一判断并非指 token 费用会超过所有工程师的工资——在美国等高薪资市场，年薪可达六位数——但「这种支出规模并非不可能」。Tyagi 透露，他已经听到「我的开发者上个月消耗了 2 万美元」「一个业务用户消耗了 3.2 万美元」这样的案例，并表示「发出这种声音的目的，就是要让行业意识到 token 成本若不加以治理将带来多大的冲击」。

治理缺位：成本可见度低，定价不透明

企业正快速从 AI 编程实验走向规模化部署，但许多组织仍低估了 token 成本。Tyagi 指出，软件工程工作负载的成本结构「高度可变」，且各家厂商对 token 消耗的计算与计费方式缺乏透明。AI 编程厂商尚未提供「成熟的、内建的成本优化能力」，而随着模型持续升级与厂商追求盈利，价格很可能继续上行。

由此带来的现实问题是：企业难以预测和控制成本；由于 AI 发展过快，许多组织缺乏评估 ROI 的「成熟度与框架」；智能体驱动的流程难以治理，上下文窗口越来越臃肿，预算经常提前耗尽，token 支出难以自证合理。Tyagi 强调，token 消耗量与开发者生产力提升之间没有「直接关系」，单纯追求 token 消耗量并不能换来更高产出；反之，应用上下文工程原则来优化或减少 token 消耗反而能提升质量。「Tokenmaxxing 与生产力提升并无直接关联，但优化 token 消耗却能带来回报。」

三类执行模式：分级授权智能体

Gartner 建议企业建立「用例驱动」的决策框架，明确在哪些场景下应使用 AI 编程智能体，以及它们在不同任务中应被授予何种级别的自主权，并将任务分为三种执行模式：

「开发者主导」：由人类完成核心工作，AI 仅作辅助。
「开发者与智能体协作」：人与 AI 各自承担一部分任务。
「完全智能体主导」：AI 自动执行，人类仅在关键节点介入。

企业还应根据任务复杂度选用模型：把高频、简单的任务路由到小模型上执行，只有在任务复杂度真正需要时才升级到前沿模型。Gartner 建议将 token 阈值、自动化用量监控、明确的升级审批流程嵌入工程工作流中，以防止成本失控蔓延。

给工程领导者的具体建议

Tyagi 提醒，开发者倾向于追求速度与便利而非成本效率，因此仅靠开发者自觉无法建立 token 纪律。Gartner 给出的行动清单包括：

训练团队进行上下文工程实践：只喂入必要信息、对内容做充分摘要、剔除无关数据。
将 token 用量评审嵌入开发周期：定期复盘高消耗工作流，识别低效环节并优化实践。
重新定义生产力衡量指标：在 AI 能瞬间生成整个 Python 库的今天，「代码行数」已经过时，价值应以质量、速度与客户满意度来度量，例如关键功能的上线速度、研发到反馈的闭环时间等。

Tyagi 强调，把不断攀升的 AI 编程成本当作远离 AI 的理由，或把所有工作都切到开源生成式模型上，都不是正解。「目标始终是在不损害价值的前提下优化成本。」他建议从小处入手，先聚焦上下文工程，评估组织当前的软件工程成熟度，并选择合适的智能体自主级别。在他看来，AI 辅助开发可带来最高约 20% 的生产力提升，「这已经是一个不错的数字」。