桃子桃子 AI 快讯
返回首页
行业动态

OpenAI 推理成本砍半,美股硬件为何不跌反涨?

OpenAI 软件优化使推理成本降超一半,但 AMD、Intel、台积电等硬件股反而上涨。文章复盘 18 个月内五轮「A…

2026.07.01 · 周三4 分钟阅读

6 月 30 日晚,The Information 报道称 OpenAI 工程师通过纯软件层面的服务器利用率优化,将推理成本压降超过一半,且主要受益方是 ChatGPT 未登录用户——此前需要大量算力承接的流量,如今几百块 NVIDIA GPU 即可应对。消息一出,AMD、Intel、SanDisk、台积电等硬件股不跌反涨:AMD 涨超 7%、Wells Fargo 将目标价从 505 美元上调至 615 美元;SanDisk 也在 Bernstein 调升至 3000 美元目标价的带动下继续走高。

近 18 个月,五轮「AI 鬼故事」为何接连失效

文章梳理了 2025 年初以来至少四轮类似「利空」:

  • 2025 年 1 月 27 日,DeepSeek 以低成本训练震动市场,英伟达单日跌 17%、市值蒸发 5890 亿美元,费城半导体指数跌 9.2%;11 个月后全部收复,英伟达创新高。
  • 2025 年 2 月,OpenAI 将八年全基建承诺 1.4 万亿美元与五年算力支出 6000 亿美元放在一起对比,引发「需求见顶」担忧;市场一周内消化完毕。
  • 2026 年 4 月 28 日,华尔街日报报道 OpenAI 周活未达 10 亿目标,CFO 警告数据中心账单或难覆盖,费城半导体指数跌 3.6%;一个月后全部收复。
  • 2026 年 6 月初,博通财报 AI 芯片营收同比涨 143%,但因实际 EPS 2.44 美元低于私下「耳语数字」2.45 美元,AMD 两日跌 12.6%、美光跌 17%、全球半导体板块蒸发逾 1 万亿美元;三周后全部收复。
  • 6 月 30 日,OpenAI 推理成本减半——市场直接不跌反涨。

五轮事件的共同特征是:每把刀都砍在「装修层」——软件、算法、推理优化、量化压缩——而没有人砍「房子」——物理芯片、内存、先进封装与代工产能。

软件越便宜,硬件反而越值钱

关键的反直觉之处在于:装修层效率提升,恰恰让房子层更值钱。文章援引 Anthropic 的数据指出,2024 年其每卖 1 美元 token 需承担近 2 美元推理硬件成本,毛利率为负 94%;到 2025 年回升至约 38%;今年二季度按对投资人的指引,推理毛利率已升至 60% 级别——不到两年,从倒贴 0.94 美元变成净赚 0.6 美元。

需求侧同样在加速膨胀。中国大模型日均词元调用量从 2024 年初的 1000 亿,增长到今年 3 月国家数据局公布的 140 万亿,两年涨幅超千倍。Agent 类应用一次任务消耗可达数百万 token,效率提升非但没有消灭需求,反而在制造需求。Meta 甚至开始将退役服务器上的旧 DDR4 内存拆下复用到 DDR5 新平台,反映出内存紧缺已到「连旧件都舍不得扔」的程度。

瓶颈已从 GPU 切到内存与 CPU

6 月 30 日盘面还有一个细节:AMD、Intel 涨超 7%,英伟达仅涨约 1.3%。资金正从 GPU 流向 CPU 与内存。

  • 闪存合约价一季度环比涨 55%–60%,二季度扩大至 70%–75%。
  • 内存占云巨头数据中心支出的比例从 2023 年约 7% 升至今年 30%,三年翻四倍多。
  • 一支内存主题 ETF 上市 10 个交易日 AUM 破 10 亿美元,25 天破 50 亿。

根本原因是 AI 从训练时代切到推理时代:训练阶段 GPU 算力决定速度,推理阶段每生成一个 token 都要反复读取模型参数——算力够用,但数据读不出来。内存与带宽取代 GPU,成为新的全产业链最紧瓶颈。

在一个需求按月翻倍、供给按年才能爬一格的市场里,物理硬件的稀缺性就是「物权」。只要 token 消耗增速持续跑赢效率提升,软件每优化一轮,硬件产出的价值就再涨一截。文章作者判断,AI 硬件的故事「快的话,还要再讲个一年半载」。

信源