AI 使用成本拆解：订阅、API、云显卡与自建硬件怎么选

一名长期关注「AI 独立」话题的开发者，近日发布了一篇基于自身 token 账单的成本分析，把 2026 年个人获取大模型能力的四种主流路径放进同一张表里对比，并给出了明确取舍建议。他的核心结论是：在当前价格下，按量付费 API 几乎在所有场景下都最便宜，自建硬件在大多数个人使用强度下难以回本，而订阅则是被平台补贴的「礼物」。

他把获取 AI 的方式归纳为四类

文章把目前个人使用大模型的方式分成四种，并对每种方式的计费逻辑做了简要描述：

订阅制：按月支付固定费用，由厂商托管模型，例如 ChatGPT Plus、Claude Pro 以及 Kimi、GLM 的编程套餐。特点是一口价、有上限、可预期。
按量付费 API：无固定费用，按百万输入 / 输出 token 单独计费，常见于自建应用或通过 OpenRouter、Fireworks、Together 等无服务器中转服务调用模型。
云上租显卡：按小时租用 GPU 实例，自行加载开源权重模型并自行服务，例如 RunPod、Vast、Lambda 等平台。计费单位是计算时长而非 token。
自有硬件：直接购买 GPU 放在本地，token 的边际成本只剩电费。

作者认为这四种方式各有适用区间，关键在于判断自己处于哪个「使用区间」。

把自己的账单放进四种模式

为了给出可比数字，作者用自己过去 60 天的实际 token 消费（他注明这还是「偏慢」的一个月）作为基准：每年大约 7800 万输入 token 加 1300 万输出 token，跑在开源模型上、走可自托管路线，再把这套用量分别套进四种模式：

按量付费 API：以 DeepSeek V4 Flash 的 $0.14 / 百万输入、$0.28 / 百万输出来算，全年约 €13；若改用他日常混用的若干开源模型，年成本约 €130。
云上租 GPU：RunPod 上跑得动 100GB 模型的 MI300X 约 $1.99 / 小时，他假设每月使用 90 小时，年成本约 €2,300，还需要额外考虑存储以避免冷启动重复下载权重。
自有硬件：一台单 GPU 的可 DIY 服务器约 €2,900 一次性投入，年电费约 €30；他想做的 4 卡 AMD 平台接近 €12,500；一对 DGX Spark 约 €9,600；Tinybox Red v2 为 $12,000 但只有 64GB 内存。
订阅制：按固定月费计算，享受前三种方式在同价位无法触及的顶级模型质量。

文章特地指出：API 比其他方案便宜大约两个数量级；云上租 GPU 是这张表里最差的选择，因为 90 小时 / 月只相当于 12% 的利用率，却要按接近「整机拥有」的价格付费；自建硬件对比 API 几乎省不下钱，€2,900 的机器相对于一年三位数欧元的 API 账单，回本周期要以「十年」为单位衡量。

决策建议与仍未解答的问题

作者给出的结论很直接：如果个人使用强度跟他类似——存在高 token 消耗的爆发期，以及大量不需要重模型的思考期——那么「按量付费为主 + 订阅留作补充」几乎是不需要犹豫的选择，自建硬件并不划算。

但他自己也承认仍在认真考虑自建硬件，因为订阅制目前是被平台补贴的状态，一旦价格回归到反映推理成本的水平，整个对比表会重新洗牌。文章最后没有给出完整的答案，而是把「订阅被补贴到什么程度」「未来 token 价格走势」「自建硬件在隐私与离线可用性上的非金钱价值」等问题留给了后续讨论。