Gartner 预警:AI 编程 token 支出两年内或追平开发者薪资
Gartner 高级分析师预测,企业 AI 编程 token 月费两年内将接近甚至超过全球平均开发者月薪,呼吁企业建立成…
- 重要性
- 58
- 新颖性
- 60
- 影响面
- 62
- 可信度
- 78
- 实质性
- 68
企业正在为开发者的 AI 编程 token 使用支付越来越高的费用。Gartner 高级首席分析师 Nitish Tyagi 预测,在未来两年内,部分企业的 AI 编程 token 月支出将追平甚至超过全球平均软件工程师月薪(约 2000 美元)。这一判断并非指 token 费用会超过所有工程师的工资——在美国等高薪资市场,年薪可达六位数——但「这种支出规模并非不可能」。Tyagi 透露,他已经听到「我的开发者上个月消耗了 2 万美元」「一个业务用户消耗了 3.2 万美元」这样的案例,并表示「发出这种声音的目的,就是要让行业意识到 token 成本若不加以治理将带来多大的冲击」。
治理缺位:成本可见度低,定价不透明
企业正快速从 AI 编程实验走向规模化部署,但许多组织仍低估了 token 成本。Tyagi 指出,软件工程工作负载的成本结构「高度可变」,且各家厂商对 token 消耗的计算与计费方式缺乏透明。AI 编程厂商尚未提供「成熟的、内建的成本优化能力」,而随着模型持续升级与厂商追求盈利,价格很可能继续上行。
由此带来的现实问题是:企业难以预测和控制成本;由于 AI 发展过快,许多组织缺乏评估 ROI 的「成熟度与框架」;智能体驱动的流程难以治理,上下文窗口越来越臃肿,预算经常提前耗尽,token 支出难以自证合理。Tyagi 强调,token 消耗量与开发者生产力提升之间没有「直接关系」,单纯追求 token 消耗量并不能换来更高产出;反之,应用上下文工程原则来优化或减少 token 消耗反而能提升质量。「Tokenmaxxing 与生产力提升并无直接关联,但优化 token 消耗却能带来回报。」
三类执行模式:分级授权智能体
Gartner 建议企业建立「用例驱动」的决策框架,明确在哪些场景下应使用 AI 编程智能体,以及它们在不同任务中应被授予何种级别的自主权,并将任务分为三种执行模式:
- 「开发者主导」:由人类完成核心工作,AI 仅作辅助。
- 「开发者与智能体协作」:人与 AI 各自承担一部分任务。
- 「完全智能体主导」:AI 自动执行,人类仅在关键节点介入。
企业还应根据任务复杂度选用模型:把高频、简单的任务路由到小模型上执行,只有在任务复杂度真正需要时才升级到前沿模型。Gartner 建议将 token 阈值、自动化用量监控、明确的升级审批流程嵌入工程工作流中,以防止成本失控蔓延。
给工程领导者的具体建议
Tyagi 提醒,开发者倾向于追求速度与便利而非成本效率,因此仅靠开发者自觉无法建立 token 纪律。Gartner 给出的行动清单包括:
- 训练团队进行上下文工程实践:只喂入必要信息、对内容做充分摘要、剔除无关数据。
- 将 token 用量评审嵌入开发周期:定期复盘高消耗工作流,识别低效环节并优化实践。
- 重新定义生产力衡量指标:在 AI 能瞬间生成整个 Python 库的今天,「代码行数」已经过时,价值应以质量、速度与客户满意度来度量,例如关键功能的上线速度、研发到反馈的闭环时间等。
Tyagi 强调,把不断攀升的 AI 编程成本当作远离 AI 的理由,或把所有工作都切到开源生成式模型上,都不是正解。「目标始终是在不损害价值的前提下优化成本。」他建议从小处入手,先聚焦上下文工程,评估组织当前的软件工程成熟度,并选择合适的智能体自主级别。在他看来,AI 辅助开发可带来最高约 20% 的生产力提升,「这已经是一个不错的数字」。
