AI 推理显然盈利：算一笔账就明白了

围绕「AI 是否全靠投资人的钱补贴」的争论从未停止。不少评论者认为大模型推理本身不赚钱，必须靠源源不断的资本输血才能维持运转。一旦资本退潮，AI 产品也将随之消失。然而，一个发表于 Hacker News 的长篇分析通过具体计算和开源模型的实际定价指出：AI 推理的盈利能力被严重低估，推理本身是赚钱的，关键在于 AI 实验室同时还要为训练新模型买单。

一、按硬件与电费推算推理成本

文章以单张 NVIDIA A100 显卡为基准，给出了一套相对保守的成本估算：

单卡功耗约 400W，按美国工业电价折算每小时电费约 13 美分；
一张 A100 售价约 2 万美元，假设使用寿命 5 年，每年需回收约 1600 美元（折合每小时 1.8 美元）才能覆盖硬件投入；
一台配置 4 张 A100 的推理服务器可运行 70B 级别的稠密模型，吞吐量约每小时 200 万 token，输出 token 综合成本约 1 美元/百万 token。

文章据此认为，「每百万 token 1 美元」是一个相当宽松的上限。而 GPT-5.4-mini 的 API 报价为 4.5 美元/百万 token，OpenAI 与 Anthropic 主力模型价格在此基础上再加 3–6 倍。前沿厂商声称 70%–80% 的毛利，与这套独立测算完全对得上。

二、开源模型的定价提供了交叉验证

如果对自建算力成本仍有疑虑，可以直接看开源模型的零售价。文章以 DeepSeek-R1 为例：

DeepSeek 官方声称该模型推理毛利略高于 80%；
其 API 定价不到 OpenAI 或 Anthropic 的一半；
由于权重完全公开，任何竞争对手都可以用同一模型低价抢市场，因此 DeepSeek 几乎不可能在毛利上注水。

当前市场上 DeepSeek-V4-Pro 等同档模型的推理报价约 87 美分/百万输出 token，这与前文算出的「每百万 token 1 美元」几乎吻合，进一步印证了独立测算的合理性。文章同时指出，量产环境还有几层额外收益：规模化冷却成本低于电费、R1 类 MoE 模型激活参数更少、更现代的 GPU 能效高于 A100，整体成本还有下降空间。

三、AI 实验室需要靠推理补贴训练

推理赚钱，并不等于 OpenAI、Anthropic 这类公司整体盈利。它们正在为下一代模型投入巨额资本、顶尖人才和训练算力，还要通过月度订阅赠送近乎「无限」的推理额度，这部分业务大概率是亏的。文章估算，如果把 Claude Code 中的 Anthropic 订阅换成同等的 API 调用，要多花约 10 倍的钱。

正因如此，AI 实验室没有主动压低 API 价格——它们要把现有模型的推理利润挤到极致，反哺训练侧的开支。也就是说：对 AI 实验室而言，推理必须补贴训练；但如果角色只是纯推理服务商，并不需要承担训练成本，那么推理本身就是一笔健康的生意。

四、纯推理业务可以独立存活

顺着这个逻辑可以推断：即便 OpenAI、Anthropic 因为训练军备竞赛烧光现金而倒闭，只要它们的前沿模型权重被新东家接手，GPT 与 Claude Opus 这类模型的推理服务依然能盈利。文章的核心结论由此而来：AI 泡沫破裂不等于推理业务终结——AI 推理显然盈利。

这也解释了为什么一些重度 agentic coding 用户已经转向 DeepSeek 等低价 API。当订阅模式里的高溢价被剥离，用按量付费的推理 API 去驱动编程智能体，在经济上反而更划算。