HBM 需求挤占标准 DRAM 产能,服务器内存价格半年暴涨 3.5 倍。AMD、Apple、Marvell、闪迪分别以…
AI 大模型的规模化部署正在把数据中心推入一场新的资源危机——不是算力不够,而是内存太贵。曾经作为服务器标配的 DRAM,如今已成为最昂贵、最稀缺的基础设施资源之一,价格暴涨与供给刚性正深刻制约着 AI 算力的部署节奏。
根据 Counterpoint Research 的追踪,64GB DIMM 内存价格在 2025 年第三季度至 2026 年第一季度之间已上涨 3.5 倍,涨势尚未见顶,预计到 2026 年第三季度累计涨幅将达 5 倍。TrendForce 数据更为直观:2026 年第一季度 DRAM 合约价季增高达 93%–98%,带动全球 DRAM 产业整体营收环比增长 81%,达到 970 亿美元;进入第二季度,合约价预计再涨 58%–63%。
现货市场同样紧绷:服务器级 DDR5 RDIMM 单价已达每 GB 27 至 37 美元,仅搭建一个 12TB 的内存池,纯 DRAM 硬件采购成本就接近 50 万美元。杰富瑞预计,若不计入国产厂商影响,2026 年全球存储 bit 供给增长仅为 7%–8%,DRAM 与 NAND 合计可能出现 15 万至 20 万片/月的供给缺口。
这轮涨价的根源在于 HBM 对 DRAM 产能的持续蚕食。随着 AI 训练与推理对高带宽内存的需求爆发,HBM 在 DRAM 晶圆产能中的占比已从 2020 年的 2% 攀升至 2026 年预估的 25%。三星、SK 海力士、美光三大原厂纷纷将优质产能向高毛利的 HBM 倾斜,一片 HBM 晶圆要消耗约三片 DDR5 的产能。超大规模云厂商又以多年期长单提前锁定未来晶圆产出,进一步压缩了面向服务器领域的标准 DRAM 供给。
压力也已从数据中心蔓延至消费端。Xbox 首席执行官 Asha Sharma 公开表示,过去两年间内存成本上涨约五倍,已影响游戏主机供应;苹果也相继对 iPhone、Mac、iPad 等产品调价。摩根士丹利分析师 Shawn Kim 团队直言,内存价格飙升正演变为数字经济的全面风险,「从 AI 基础设施的瓶颈,蔓延至硬件利润率、设备可负担性、云成本乃至通胀与政策层面」。
面对 DRAM 的昂贵与稀缺,行业玩家开始另辟蹊径,不再单纯堆硬件,而是用技术手段减少对 DRAM 的依赖。AMD 选择了最轻量的软件切入路径:2026 年 6 月宣布收购内存优化厂商 MEXT,引入基于 AI 的内存分层技术。
MEXT 的核心产品是预测内存引擎(Predictive Memory Engine),一套完全基于软件的内存分层方案:
官方数据显示,该方案可将系统有效内存容量提升 2 至 4 倍,基础设施整体成本下降约 50%;在 Neo4j 图数据库、EDA 仿真、影视渲染等场景中,DRAM 与闪存 1:1 配比的配置可达纯 DRAM 配置约 95% 的吞吐量。收购消息公布当日,AMD 股价盘中上涨近 7%。
当数据中心为 DRAM 成本头疼,消费端也面临同样约束——手机等终端的 DRAM 容量极为有限,却要承载端侧大模型推理。苹果的解法是让大模型常驻闪存、按需加载到内存。
苹果最新的 AFM 3 Core Advanced 是一款 200 亿参数的端侧大模型,若按传统方式全部加载到 DRAM,远超消费级设备上限。苹果采用稀疏激活架构破解难题:
这套思路早在 2024 年苹果发表的《LLM in a Flash》论文中已有系统验证,可在 CPU 和 GPU 上分别实现比朴素加载快 4–5 倍和 20–25 倍的推理速度。当 DRAM 涨价从产业端传导至消费电子,这套方案既支撑了端侧 AI 体验,也降低了对大容量 DRAM 的依赖。
如果说 AMD 与苹果走的是软件与架构优化路线,Marvell 则选择硬件层面的突破。2026 年 6 月,Marvell 发布 Structera 系列 CXL 控制器——Structera X(内存扩展控制器)与 Structera A(近内存加速器),两款芯片均内置自研 CDB 硬件压缩模块。
数据写入 DRAM 时,CDB 模块通过定制化 LZ4 无损算法实时压缩,读取时同步解压,整个过程在内存链路中独立完成,不占用主机 CPU 算力,对上层应用完全透明。根据数据类型不同,1GB 物理 DRAM 可发挥 2 至 3.64 倍的等效逻辑容量。
附加价值同样可观:
按当前 DDR5 现货价计算,一个 12TB 内存池若采用 3 倍压缩比,物理 DRAM 采购量可缩减三分之二,单池节省超 30 万美元。Structera 也是业内首款量产的搭载硬件内联压缩的 CXL 控制器,方案已提交 OCP 标准化。
闪迪的方案更为激进——从封装层面重构 AI 芯片的内存架构。闪迪正联合 SK 海力士推动高带宽闪存(HBF)标准化,试图在 HBM 与 SSD 之间建立全新存储层级。
其专利方案提出「GPU 下的 NAND」架构:将高容量 NAND 闪存堆叠在 GPU 或 AI 加速器正下方,周围环绕 HBM 堆叠,通过缩短数据传输距离提升闪存访问带宽。HBF 与 HBM4 物理兼容,容量可达同体积 HBM 的 8 至 16 倍,主打长上下文推理、KV 缓存、模型权重流式加载等读取密集型场景。
2026 年 2 月,闪迪与 SK 海力士正式启动 HBF 规范标准化联盟,计划 2026 年下半年推出首批样品,2027 年初应用于 AI 推理设备。目标是构建三级内存架构:HBM 负责超低延迟即时计算,HBF 承接大容量、高吞吐读取数据,SSD 承载冷存储。据韩国新荣证券预计,HBF 市场有望在 2027 年形成,到 2030 年增长至 120 亿美元规模。
用闪存扩展主内存并非新鲜事。早在 2015 年,英特尔与美光就联合推出 3D XPoint 存储技术,试图在 DRAM 与 NAND 之间构建新层级。但制程研发滞后让成本追平 DRAM、性能仅比普通闪存快数倍,加之英特尔将其绑定自家 Xeon 的封闭策略,使其始终未能进入主流市场,项目最终终止,英特尔闪存业务也被出售给 SK 海力士。
历史教训表明,存储分层技术的成败,既取决于性能与成本的平衡,也取决于生态开放程度。在 DRAM 价格高企、HBM 持续挤占标准内存产能的背景下,AMD、Apple、Marvell、闪迪分别从软件调度、模型架构、硬件压缩、封装创新四个维度给出了各自的答案,AI 推理的内存层级正在被重构:低频 KV 缓存、模型权重及端侧数据将逐步从高价 HBM/DRAM 下沉至 NAND Flash/SSD 层,形成多层次存储架构。这一转变也意味着,NAND 原厂、内存池化方案商与存算一体初创公司,将在新一轮产业周期中获得更多关注。