桃子桃子快讯
返回首页
行业动态

AI 规模化部署遇阻:Token 成本三重黑洞解析

艾瑞咨询报告拆解企业 AI 部署中 Token 成本失控的数量、工具与治理三重结构性机制,引用 Gartner、IDC、…

2026.07.03 · 周五5 分钟阅读

企业级生成式 AI 正从「试点可行」迈入「规模化部署」,但随之而来的 Token 成本失控问题,正成为越来越多组织的隐形障碍。艾瑞咨询近期发布的研究报告指出,Token 成本的不可控并非简单的「用量过多」,而是由数量失控、单价失控、管理真空三重机制叠加形成的系统性黑洞。

行业背景:从试点到规模化的分水岭

Gartner 追踪数据显示,过去 18 个月内全球部署过生成式 AI 试点的企业比例从约 45% 跃升至超过 90%,但真正进入生产环境并形成规模化价值的项目占比不足 41%。IDC 预测 2025 年全球 AI 支出将突破 3000 亿美元,汽车与媒体文娱行业生成式 AI 渗透率达 100%,全球银行业突破 90%。然而,报告强调,大模型按量计费模式下,Token 消耗成本的增速会系统性超越业务流量增速——这与云迁移时期线性、可预期的成本增长截然不同。

报告列举了若干典型失控案例:

  • Uber 全年规划的 Token 预算仅四个月即耗尽。
  • 米哈游在一次多 Agent 实验中,因几十个智能体陷入死循环,一晚消耗约 200 万元人民币的 Token。
  • 一家领先在线旅游企业在进入规模 AI 应用后,月度 Token 消耗短期内增长近 30 倍,同期业务流量增幅仅为其十分之一。

高盛进一步预测,受 AI 智能体大规模调用驱动,2030 年全球 Token 消耗量将达到 2026 年的 24 倍。

第一重黑洞:无效调用的系统性放大

报告将数量层面的浪费归因于四类系统性来源:

  • 重复请求:用户在智能客服、知识库问答等高频场景中反复发送完全一致的咨询内容。阿里云测算显示,未优化的智能客服场景中此类重复请求占比超过 30%。
  • 多渠道重复发送:同一用户的同一业务请求从官网、App、小程序等多个入口分别触达大模型。某头部零售企业将 AI 客服部署于三个流量入口后,Token 消耗接近三倍。
  • 对话结束后的空转:用户关闭页面后系统仍继续向模型发送历史对话数据。
  • 异常重试风暴:网络波动或服务商限流时,一次普通请求被层层重试数十次甚至上百次。

报告认为,这四类浪费均根植于组织技术架构在流量治理层面的系统性缺陷,仅靠约束个人行为无法根除。

第二重黑洞:复杂任务的资源诅咒

即使消除全部无效调用,单次合理调用的成本本身也在攀升。报告将其归因于三类场景特性:

  • 多轮交互下的上下文膨胀:行业实测显示,多轮对话超过 5 轮后,单位任务 Token 消耗比单轮场景高出 4 倍以上。
  • AI Agent 的任务级联放大:以「订机票 + 酒店 + 租车」复合场景为例,用户原始输入 Token 占比不足 1%,模型内部推理链约占 5%–10%,85%–90% 的消耗来自智能体的工具调用过程。高盛预测,未来四年 AI 智能体的计算资源消耗将达到当前常规场景的 50 倍。
  • 任务失败与循环惩罚:子任务调用失败、重试或无意义循环会导致 Token 消耗成倍增长,且缺乏自动止损机制。

第三重黑洞:治理体系的系统性缺失

报告指出,多数组织沿用传统 IT 资源管理逻辑来治理 AI 计算资源,由此产生三层管理真空:

  • 成本溯源能力缺失:账单颗粒度仅覆盖云服务商总金额,无法匹配到具体业务线或团队。一组对照案例显示,两家规模相近的企业接入 GPT-4 服务三个月后,A 企业账单 4.7 万元、B 企业仅 1.5 万元,差距主要来自测试环境无效调用的有无标签化管理。
  • 预算刹停机制缺位:试点阶段为保障高可用配置了无上限资源配额,但未配套分级告警与弹性降级策略。某头部券商在统一 API 网关上配置分级流量管控后,一次营销活动中成本增幅被控制在 10% 以内。
  • 考核导向助推高消耗:「场景覆盖度」「调用增长量」等考核指标天然驱动团队优先使用高成本旗舰模型,亚马逊曾出现的内部 Token 消耗排行榜导致员工刷榜、月支出高达 5 亿美元的案例即为典型。

治理路径与结语

报告认为,技术架构层建立缓存复用、语义去重、异常熔断等机制可削减第一重黑洞;业务场景层建立模型选型与场景价值的匹配规则可控制第二重黑洞;组织治理层建立标签化成本溯源、分级预算管控和实效维度考核指标可解除第三重黑洞。三者构成嵌套依存关系,治理体系的完整程度决定了前两层优化效果的上限。

报告最后指出,AI 规模化落地的真正分水岭不在于采购了多先进的模型,而在于是否建立了与 Token 消耗特性相匹配的精细化治理体系。正如云计算转型教会了组织治理弹性资源一样,AI 规模化部署正在考验另一个命题:组织治理能力的进化速度,本身就是最核心的竞争力。

信源