桃子桃子 AI 快讯
返回首页
行业动态

AI 价值捕获洗牌:模型层正夺走基础设施的蛋糕

SemiAnalysis 指出,Agentic AI 跨过拐点后,模型厂商以高毛利吸纳价值,硬件与推理生态同步重定价。

2026.06.29 · 周一4 分钟阅读评分 74
评分细项加权总分 74
重要性
72
新颖性
70
影响面
75
可信度
82
实质性
78

AI 产业正经历价值捕获格局的重构。SemiAnalysis 近日发文指出,过去数年价值主要沉淀在基础设施层,而自 2025 年底 Agentic AI 真正可用以来,模型厂商开始以前所未有的速度吸纳产业链利润,推理经济与硬件定价也随之被重新改写。

Agentic AI 跨过真实拐点

SemiAnalysis 认为,2025 年 12 月是 Agentic AI 的转折点,其应用已不再局限于编程,而是渗透到分析师的日常工作中——将 Excel 模型转化为仪表盘、生成图表、构建财务模型、分析财报等。这些任务此前要么无法完成,要么需要初级分析师耗费数小时。

以 SemiAnalysis 自身为例,其在 Anthropic Claude 上的年化 token 支出已占员工薪酬总额的约 30%,人均每月消耗近 50 亿 token(是 Meta 的 5 倍以上),且呈幂律分布,部分团队成员每月消耗超过 1000 亿 token。

模型层价值快速聚集

文章披露了几个关键数字:

  • Anthropic 的 ARR 在年内从 90 亿美元飙升至超过 440 亿美元。
  • 其推理基础设施毛利率同期从 38% 提升至 70% 以上。
  • SemiAnalysis 自身在 Claude token 上的年化支出高达约 1095 万美元。

毛利率改善的核心驱动是单位 token 成本下降。SemiAnalysis 估算,在 Agentic 场景下运行 Opus 4.7 的真实混合价格约为每百万 token 0.99 美元,而官方标价为 5 美元(输入)/ 25 美元(输出)。原因在于:

  • Agentic 工作负载的输入/输出比极高(Claude Code 约 300:1)。
  • 缓存命中率超过 90%,命中后的输入 token 单价仅 0.50 美元。

硬件与推理生态同步重定价

价值捕获并非只发生在模型层,整个推理与硬件生态都在被重新定价:

  • 加速器代际跃迁显著摊薄成本:Blackwell 在前沿负载下相对 Hopper 的 token 产出提升约 30 倍;TPUv7、Trainium 3 等 ASIC 也有相近提升。
  • 推理服务商(Fireworks、Baseten、Fal 等)毛利率走阔,营收呈高增长。
  • 内存价格过去一年上涨约 6 倍。
  • H100 一年期租赁合约价较 2025 年 10 月低点上涨约 40%。

文章回顾了 2023—2025 年价值在基础设施层的迁移路径:2023 年 5 月 Nvidia 财报成为 AI 交易起点;2024 年电力成为瓶颈,Vistra(+265%)、GE Vernova(+146%)领涨 S&P 500;2025 年存储接棒,SanDisk、Western Digital、Seagate、Micron 涨幅均超 200%。

TSMC 与 Nvidia 仍待反应

SemiAnalysis 强调,行业中拥有最强定价权的两家厂商——TSMC 和 Nvidia——至今未对 AI 模型价值生成的爆发做出明显响应。文章提出的「One Chart to Rule Them All」框架,将围绕 GPU 租赁经济,分析终端用户、Neocloud/超大规模云、AI 系统供应商之间的价值分配格局。

总体来看,AI 产业的利润重心正从「卖铲子」的基础设施层,加速向「真正把铲子用出价值」的模型与应用层转移,而算力与内存供给的紧平衡,则为下一轮价值再分配埋下伏笔。

信源