桃子桃子快讯
返回首页
行业动态

Token 通胀来袭:AI 账单狂飙,效益却难言

大厂 Token 消耗指数级膨胀,账单失控背后是定价策略、Agent 低效与全员焦虑的多重叠加。

2026.07.03 · 周五5 分钟阅读

2026 年上半年,从中关村到硅谷,大厂茶水间里最热的话题变成了一句:「你今天烧了多少?」他们聊的不是人民币,而是 Token。据国家数据局数据,2026 年 3 月中国日均 Token 调用量已突破 140 万亿,较 2024 年初的 1000 亿增长超千倍。当 Token 消耗以指数级膨胀,AI 账单失控便不再是孤例。

从极大化使用,到限量使用

2026 年初,硅谷刮起「Tokenmaxxing」(极大化 Token 使用量)风潮:Meta 上线追踪 8.5 万名员工 Token 消耗的排行榜,给排名靠前者授予「Token 传说」「缓存大师」等称号;亚马逊推出内部榜单「KiroRank」,将消耗数据纳入团队考评;英伟达 CEO 黄仁勋公开表示,「如果我的工程师消耗的 Token 价值达不到他们年薪的一半,我会深感忧虑」。

国内厂商迅速跟进。腾讯在 2026 年 3 月推出全员 AI 激励计划,为员工提供每人年均 22 万元的 Token 资源,覆盖 Cursor、CodeBuddy 等多款工具。

然而,账单很快失控:

  • Meta 员工 30 天消耗 60.2 万亿 Token,成本超 1 亿美元;
  • Uber 仅用 4 个月便耗尽 2026 年全年 AI 预算,管理层紧急出台限额令,每位员工每月 AI 工具费用不得超过 1500 美元;
  • 腾讯随后下发额度调整通知,核心研发团队月额度收紧至 7000 元,外包岗位砍至 1000 元。

OpenAI CEO 山姆·奥特曼近日在企业客户活动上坦言:「今年年初,AI 运行成本还是一个从未被提起的问题,现在突然变成了一个巨大的问题。」

Token 账单暴涨之谜

账单费用 = 用量 × 价格。这道简单公式背后,藏着两层推高逻辑。

其一,高价值场景价格逆势上涨。 大模型价格普降的印象只对了一半——通用轻量模型确实越来越便宜,但编程、长上下文、复杂推理等企业刚需场景,价格反而在涨。

  • Anthropic 安全增强版 Fable 5:输入 10 美元/百万 Token、输出 50 美元,是同期 Opus 系列的两倍;
  • 智谱 AI 2026 年一季度连续三次上调核心 API 价格,累计涨幅达 83%,面向编程与 Agent 场景的 GLM-5.2 输出价达 28 元/百万 Token;
  • 腾讯云混元 HY 2.0 Instruct 模型输入价格涨幅高达 463%;MiniMax 核心模型价格上调 30%–50%。

其二,Agent 跃迁带来结构性低效。 从对话式 AI 向 Agent 跃迁后,Token 消耗从线性增长变为指数膨胀。腾讯研究院分析指出,Agent 任务存在四类典型浪费:

  • 上下文陷阱:智能体每步操作都重复带入历史对话、工具日志和文件内容;
  • 技能冗余:对 49 个软件工程技能的基准测试显示,79.6% 的技能对任务通过率无提升,却最高带来 451% 的 Token 开销增长;
  • 多 Agent「沟通税」:协作时不断重复任务背景与格式化套话;
  • 长任务「熵增」:链条越长越易跑偏,纠偏机制进一步推高消耗。

这些损耗相互叠加,形成乘积效应。复杂多 Agent 任务中,近一半 Token 花费在内部协调与自我纠偏上。

踏空的恐惧

如果说厂商定价是外部「阳谋」,企业内部则是一场自上而下的「自我掏空」。担心踏空 AI 变革,企业将 AI 代码率、工具使用时长写入 OKR,倒逼员工刷消耗。简单邮件、基础代码、常规查询,明明几秒可解,也要交给大模型跑一遍。

更反常识的是,大量基础场景里用 AI 比人工更贵:

  • 国内某人力资源服务商测算:AI 筛选并初评一份简历,Token 加系统成本约 1.2 元/份,雇佣兼职仅需 0.8 元;
  • 某软件公司反馈:引入 AI 编程工具后,高级工程师评审工作量翻倍,线上故障返工成本增加 30% 以上。

据晚点 LatePost 报道,一位互联网大厂技术管理者坦言,部门 20 多人一个月消耗 5 万元 Token,回头却没沉淀出几个可落地的成果。这正是 Token 经济最核心的矛盾:消耗与价值之间从来不是线性关系。

写在最后

Token 通胀的推手,不是某一家厂商的恶意营销,也不是某几个员工的滥用浪费,而是所有人。从底层算力供应商、大模型架构的天然膨胀,到每一个怕踏空的企业、每一位担心落伍的员工,共同推高了消耗、推动了贬值、推厚了账单。高盛预计,到 2030 年全球 Token 月消耗量将比 2026 年增长 24 倍。账单能否回归价值本身,取决于行业何时走出「用得多 = 创造多」的幻觉。

信源