桃子桃子 AI 快讯
返回首页
行业动态

Gartner 预警:AI 编程 token 支出两年内或追平开发者薪资

Gartner 高级分析师预测,企业 AI 编程 token 月费两年内将接近甚至超过全球平均开发者月薪,呼吁企业建立成…

2026.06.28 · 周日4 分钟阅读评分 62
评分细项加权总分 62
重要性
58
新颖性
60
影响面
62
可信度
78
实质性
68

企业正在为开发者的 AI 编程 token 使用支付越来越高的费用。Gartner 高级首席分析师 Nitish Tyagi 预测,在未来两年内,部分企业的 AI 编程 token 月支出将追平甚至超过全球平均软件工程师月薪(约 2000 美元)。这一判断并非指 token 费用会超过所有工程师的工资——在美国等高薪资市场,年薪可达六位数——但「这种支出规模并非不可能」。Tyagi 透露,他已经听到「我的开发者上个月消耗了 2 万美元」「一个业务用户消耗了 3.2 万美元」这样的案例,并表示「发出这种声音的目的,就是要让行业意识到 token 成本若不加以治理将带来多大的冲击」。

治理缺位:成本可见度低,定价不透明

企业正快速从 AI 编程实验走向规模化部署,但许多组织仍低估了 token 成本。Tyagi 指出,软件工程工作负载的成本结构「高度可变」,且各家厂商对 token 消耗的计算与计费方式缺乏透明。AI 编程厂商尚未提供「成熟的、内建的成本优化能力」,而随着模型持续升级与厂商追求盈利,价格很可能继续上行。

由此带来的现实问题是:企业难以预测和控制成本;由于 AI 发展过快,许多组织缺乏评估 ROI 的「成熟度与框架」;智能体驱动的流程难以治理,上下文窗口越来越臃肿,预算经常提前耗尽,token 支出难以自证合理。Tyagi 强调,token 消耗量与开发者生产力提升之间没有「直接关系」,单纯追求 token 消耗量并不能换来更高产出;反之,应用上下文工程原则来优化或减少 token 消耗反而能提升质量。「Tokenmaxxing 与生产力提升并无直接关联,但优化 token 消耗却能带来回报。」

三类执行模式:分级授权智能体

Gartner 建议企业建立「用例驱动」的决策框架,明确在哪些场景下应使用 AI 编程智能体,以及它们在不同任务中应被授予何种级别的自主权,并将任务分为三种执行模式:

  • 「开发者主导」:由人类完成核心工作,AI 仅作辅助。
  • 「开发者与智能体协作」:人与 AI 各自承担一部分任务。
  • 「完全智能体主导」:AI 自动执行,人类仅在关键节点介入。

企业还应根据任务复杂度选用模型:把高频、简单的任务路由到小模型上执行,只有在任务复杂度真正需要时才升级到前沿模型。Gartner 建议将 token 阈值、自动化用量监控、明确的升级审批流程嵌入工程工作流中,以防止成本失控蔓延。

给工程领导者的具体建议

Tyagi 提醒,开发者倾向于追求速度与便利而非成本效率,因此仅靠开发者自觉无法建立 token 纪律。Gartner 给出的行动清单包括:

  • 训练团队进行上下文工程实践:只喂入必要信息、对内容做充分摘要、剔除无关数据。
  • 将 token 用量评审嵌入开发周期:定期复盘高消耗工作流,识别低效环节并优化实践。
  • 重新定义生产力衡量指标:在 AI 能瞬间生成整个 Python 库的今天,「代码行数」已经过时,价值应以质量、速度与客户满意度来度量,例如关键功能的上线速度、研发到反馈的闭环时间等。

Tyagi 强调,把不断攀升的 AI 编程成本当作远离 AI 的理由,或把所有工作都切到开源生成式模型上,都不是正解。「目标始终是在不损害价值的前提下优化成本。」他建议从小处入手,先聚焦上下文工程,评估组织当前的软件工程成熟度,并选择合适的智能体自主级别。在他看来,AI 辅助开发可带来最高约 20% 的生产力提升,「这已经是一个不错的数字」。

信源