Token 降本终局是电力：AI 基础设施的算账逻辑

过去一年，DeepSeek、通义千问、智谱、稀宇科技等国产模型持续降价，把大模型调用价格拉到了一个新的区间。但优刻得董事长兼 CEO 季昕华在接受 InfoQ 采访时指出，今天企业老板最关心的三件事依次是：让员工用上 AI、控制 AI 成本、提升效率——AI 已从「用不用」进入「算账」阶段。Token 表面是 API 标价问题，背后却是一条贯穿电力、土地、机柜、制冷、网络、GPU 调度与企业使用方式的完整链条。

Token 成本的底层是电力与选址

季昕华直言：Token 的终局是电力，电便宜，Token 就便宜。优刻得副总裁刘杰以一台国外顶级服务器为例算了一笔账：单台功耗约 6.5 千瓦，配 8 张 GPU 卡，千卡集群约需 125 台服务器，仅服务器本身一年耗电量已相当可观，再乘上 PUE 系数才是数据中心真正承担的总用电。

选址直接决定了这一成本。2017 年优刻得筹划乌兰察布数据中心时，AI 还未真正起来，但乌兰察布具备四个关键条件：电价低、可实现 100% 绿电、年均气温低利于降低 PUE、距北京近便于网络与人员往来。这些条件在云计算时代重要，在 AI 时代更关键。

普通机柜已难以承载 AI 算力。优刻得青浦数据中心约 42 亩、设计容量约 5000 个机柜，乌兰察布园区约 212 亩、设计容量约 12000 个机柜；但现场交流中提到，传统低功率机柜与高功率机柜已是两套体系，液冷单机柜可做到 35 千瓦，背后需要电路与散热系统专门改造。季昕华透露，国内部分低功率数据中心空置率较高，而高功率数据中心「还没建完就有订单进来」。

五条 Token 降本路径

季昕华在采访中给出五个方向：

使用国内模型：DeepSeek 等国产模型价格优势明显，80 分模型若能完成任务且成本显著更低，往往比 85 分模型更现实。
提升「每度电产生的 Token 数」：GPU 利用率、推理框架、模型部署、网络通信、存储读写都会影响转化效率，这把问题重新拉回基础设施。
选择合适的数据中心位置：乌兰察布适合训练与北方推理，青浦适合华东时延敏感场景，对应「东数西算」的分工逻辑。
模型组合与动态路由：把任务拆开，让不同模型处理各自擅长的部分，真正需要顶级模型的部分可能只占 20%。
Prompt 管理与使用规则：建立内部使用规范，避免简单问题调用高价模型、重复调用等情况。

这五条路径把降本从基础设施层面延伸到了组织管理层面。季昕华提到，优刻得内部每天都会查看 AI 使用报告，统计有多少员工在用、花了多少钱、用在什么场景。AI 铺开后会带来三类问题：员工仍在摸索、部分调用是个人使用而非业务使用、真正用于工作的部分难以衡量产出。

基础设施瓶颈会不断移动

季昕华把国内外瓶颈做了区分：国内最大问题是缺卡，海外则是缺数据中心。国内 GPU 供应受限是首要矛盾，但拿到卡之后仍需高功率数据中心来承载；而物理世界的电网、水、机房、施工周期都有现实约束，数字需求的指数级增长难以匹配。

系统级瓶颈会不断迁移：先是不够 GPU，再是内存不足，再是卡间网络连接，再是 CPU 调度，再是跨机房带宽与延迟。优刻得观察到，目前主流仍是集中式部署，未来可能在边缘侧做缓存，类似 CDN 的「以存代算」逻辑。

国产算力方面，季昕华认为目前已到「可用状态」，但整体性能与海外高端产品仍有差距，国产算力真正起来需要形成模型、框架、工具链与应用端的生态闭环，而非单卡参数比拼。

中立的 Token 供应商定位

优刻得将自己的角色定位为中立算力与模型服务平台。季昕华表示，过去中立性是面向游戏、电商等客户的标签，AI 时代这一属性被放大：阿里有通义千问、腾讯有混元、字节有豆包，创业型大模型公司选择中立第三方云厂商更易获得资源支持。优刻得在 Token 层面同样保持中立，可接入多个 Token 来源并为客户选择合适模型。

对于 Token 需求是否长期持续，季昕华判断为明确增长：Coding 能力让 AI 真正进入「干活」阶段，图片视频模型释放短剧漫剧等内容需求，企业内部财务、HR、市场等岗位开始使用 AI，录音转写、智能眼镜、智能戒指等硬件入口也在持续消耗 Token。这些需求并非单次尝鲜，而是工作流、内容流与硬件入口的常态化消耗，这也支撑了高功率数据中心长期供不应求的判断。

Token 成本的底层是电力与选址

五条 Token 降本路径

季昕华在采访中给出五个方向：

使用国内模型：DeepSeek 等国产模型价格优势明显，80 分模型若能完成任务且成本显著更低，往往比 85 分模型更现实。

提升「每度电产生的 Token 数」：GPU 利用率、推理框架、模型部署、网络通信、存储读写都会影响转化效率，这把问题重新拉回基础设施。

选择合适的数据中心位置：乌兰察布适合训练与北方推理，青浦适合华东时延敏感场景，对应「东数西算」的分工逻辑。

模型组合与动态路由：把任务拆开，让不同模型处理各自擅长的部分，真正需要顶级模型的部分可能只占 20%。

Prompt 管理与使用规则：建立内部使用规范，避免简单问题调用高价模型、重复调用等情况。

基础设施瓶颈会不断移动

中立的 Token 供应商定位