AI 推理显然盈利:算一笔账就明白了
通过算力成本测算与开源模型定价对比,论证 AI 推理服务本身就具备可观利润,无需依赖资本补贴。
围绕「AI 是否全靠投资人的钱补贴」的争论从未停止。不少评论者认为大模型推理本身不赚钱,必须靠源源不断的资本输血才能维持运转。一旦资本退潮,AI 产品也将随之消失。然而,一个发表于 Hacker News 的长篇分析通过具体计算和开源模型的实际定价指出:AI 推理的盈利能力被严重低估,推理本身是赚钱的,关键在于 AI 实验室同时还要为训练新模型买单。
一、按硬件与电费推算推理成本
文章以单张 NVIDIA A100 显卡为基准,给出了一套相对保守的成本估算:
- 单卡功耗约 400W,按美国工业电价折算每小时电费约 13 美分;
- 一张 A100 售价约 2 万美元,假设使用寿命 5 年,每年需回收约 1600 美元(折合每小时 1.8 美元)才能覆盖硬件投入;
- 一台配置 4 张 A100 的推理服务器可运行 70B 级别的稠密模型,吞吐量约每小时 200 万 token,输出 token 综合成本约 1 美元/百万 token。
文章据此认为,「每百万 token 1 美元」是一个相当宽松的上限。而 GPT-5.4-mini 的 API 报价为 4.5 美元/百万 token,OpenAI 与 Anthropic 主力模型价格在此基础上再加 3–6 倍。前沿厂商声称 70%–80% 的毛利,与这套独立测算完全对得上。
二、开源模型的定价提供了交叉验证
如果对自建算力成本仍有疑虑,可以直接看开源模型的零售价。文章以 DeepSeek-R1 为例:
- DeepSeek 官方声称该模型推理毛利略高于 80%;
- 其 API 定价不到 OpenAI 或 Anthropic 的一半;
- 由于权重完全公开,任何竞争对手都可以用同一模型低价抢市场,因此 DeepSeek 几乎不可能在毛利上注水。
当前市场上 DeepSeek-V4-Pro 等同档模型的推理报价约 87 美分/百万输出 token,这与前文算出的「每百万 token 1 美元」几乎吻合,进一步印证了独立测算的合理性。文章同时指出,量产环境还有几层额外收益:规模化冷却成本低于电费、R1 类 MoE 模型激活参数更少、更现代的 GPU 能效高于 A100,整体成本还有下降空间。
三、AI 实验室需要靠推理补贴训练
推理赚钱,并不等于 OpenAI、Anthropic 这类公司整体盈利。它们正在为下一代模型投入巨额资本、顶尖人才和训练算力,还要通过月度订阅赠送近乎「无限」的推理额度,这部分业务大概率是亏的。文章估算,如果把 Claude Code 中的 Anthropic 订阅换成同等的 API 调用,要多花约 10 倍的钱。
正因如此,AI 实验室没有主动压低 API 价格——它们要把现有模型的推理利润挤到极致,反哺训练侧的开支。也就是说:对 AI 实验室而言,推理必须补贴训练;但如果角色只是纯推理服务商,并不需要承担训练成本,那么推理本身就是一笔健康的生意。
四、纯推理业务可以独立存活
顺着这个逻辑可以推断:即便 OpenAI、Anthropic 因为训练军备竞赛烧光现金而倒闭,只要它们的前沿模型权重被新东家接手,GPT 与 Claude Opus 这类模型的推理服务依然能盈利。文章的核心结论由此而来:AI 泡沫破裂不等于推理业务终结——AI 推理显然盈利。
这也解释了为什么一些重度 agentic coding 用户已经转向 DeepSeek 等低价 API。当订阅模式里的高溢价被剥离,用按量付费的推理 API 去驱动编程智能体,在经济上反而更划算。
