AI 竞争已从 API 价格下沉到电力与数据中心选址,优刻得提出五条 Token 降本路径。
过去一年,DeepSeek、通义千问、智谱、稀宇科技等国产模型持续降价,把大模型调用价格拉到了一个新的区间。但优刻得董事长兼 CEO 季昕华在接受 InfoQ 采访时指出,今天企业老板最关心的三件事依次是:让员工用上 AI、控制 AI 成本、提升效率——AI 已从「用不用」进入「算账」阶段。Token 表面是 API 标价问题,背后却是一条贯穿电力、土地、机柜、制冷、网络、GPU 调度与企业使用方式的完整链条。
季昕华直言:Token 的终局是电力,电便宜,Token 就便宜。优刻得副总裁刘杰以一台国外顶级服务器为例算了一笔账:单台功耗约 6.5 千瓦,配 8 张 GPU 卡,千卡集群约需 125 台服务器,仅服务器本身一年耗电量已相当可观,再乘上 PUE 系数才是数据中心真正承担的总用电。
选址直接决定了这一成本。2017 年优刻得筹划乌兰察布数据中心时,AI 还未真正起来,但乌兰察布具备四个关键条件:电价低、可实现 100% 绿电、年均气温低利于降低 PUE、距北京近便于网络与人员往来。这些条件在云计算时代重要,在 AI 时代更关键。
普通机柜已难以承载 AI 算力。优刻得青浦数据中心约 42 亩、设计容量约 5000 个机柜,乌兰察布园区约 212 亩、设计容量约 12000 个机柜;但现场交流中提到,传统低功率机柜与高功率机柜已是两套体系,液冷单机柜可做到 35 千瓦,背后需要电路与散热系统专门改造。季昕华透露,国内部分低功率数据中心空置率较高,而高功率数据中心「还没建完就有订单进来」。
季昕华在采访中给出五个方向:
这五条路径把降本从基础设施层面延伸到了组织管理层面。季昕华提到,优刻得内部每天都会查看 AI 使用报告,统计有多少员工在用、花了多少钱、用在什么场景。AI 铺开后会带来三类问题:员工仍在摸索、部分调用是个人使用而非业务使用、真正用于工作的部分难以衡量产出。
季昕华把国内外瓶颈做了区分:国内最大问题是缺卡,海外则是缺数据中心。国内 GPU 供应受限是首要矛盾,但拿到卡之后仍需高功率数据中心来承载;而物理世界的电网、水、机房、施工周期都有现实约束,数字需求的指数级增长难以匹配。
系统级瓶颈会不断迁移:先是不够 GPU,再是内存不足,再是卡间网络连接,再是 CPU 调度,再是跨机房带宽与延迟。优刻得观察到,目前主流仍是集中式部署,未来可能在边缘侧做缓存,类似 CDN 的「以存代算」逻辑。
国产算力方面,季昕华认为目前已到「可用状态」,但整体性能与海外高端产品仍有差距,国产算力真正起来需要形成模型、框架、工具链与应用端的生态闭环,而非单卡参数比拼。
优刻得将自己的角色定位为中立算力与模型服务平台。季昕华表示,过去中立性是面向游戏、电商等客户的标签,AI 时代这一属性被放大:阿里有通义千问、腾讯有混元、字节有豆包,创业型大模型公司选择中立第三方云厂商更易获得资源支持。优刻得在 Token 层面同样保持中立,可接入多个 Token 来源并为客户选择合适模型。
对于 Token 需求是否长期持续,季昕华判断为明确增长:Coding 能力让 AI 真正进入「干活」阶段,图片视频模型释放短剧漫剧等内容需求,企业内部财务、HR、市场等岗位开始使用 AI,录音转写、智能眼镜、智能戒指等硬件入口也在持续消耗 Token。这些需求并非单次尝鲜,而是工作流、内容流与硬件入口的常态化消耗,这也支撑了高功率数据中心长期供不应求的判断。