DRAM 涨价风暴席卷 AI 基础设施：四路厂商如何突围

AI 大模型的规模化部署正在把数据中心推入一场新的资源危机——不是算力不够，而是内存太贵。曾经作为服务器标配的 DRAM，如今已成为最昂贵、最稀缺的基础设施资源之一，价格暴涨与供给刚性正深刻制约着 AI 算力的部署节奏。

涨价幅度与产业链传导

根据 Counterpoint Research 的追踪，64GB DIMM 内存价格在 2025 年第三季度至 2026 年第一季度之间已上涨 3.5 倍，涨势尚未见顶，预计到 2026 年第三季度累计涨幅将达 5 倍。TrendForce 数据更为直观：2026 年第一季度 DRAM 合约价季增高达 93%–98%，带动全球 DRAM 产业整体营收环比增长 81%，达到 970 亿美元；进入第二季度，合约价预计再涨 58%–63%。

现货市场同样紧绷：服务器级 DDR5 RDIMM 单价已达每 GB 27 至 37 美元，仅搭建一个 12TB 的内存池，纯 DRAM 硬件采购成本就接近 50 万美元。杰富瑞预计，若不计入国产厂商影响，2026 年全球存储 bit 供给增长仅为 7%–8%，DRAM 与 NAND 合计可能出现 15 万至 20 万片/月的供给缺口。

这轮涨价的根源在于 HBM 对 DRAM 产能的持续蚕食。随着 AI 训练与推理对高带宽内存的需求爆发，HBM 在 DRAM 晶圆产能中的占比已从 2020 年的 2% 攀升至 2026 年预估的 25%。三星、SK 海力士、美光三大原厂纷纷将优质产能向高毛利的 HBM 倾斜，一片 HBM 晶圆要消耗约三片 DDR5 的产能。超大规模云厂商又以多年期长单提前锁定未来晶圆产出，进一步压缩了面向服务器领域的标准 DRAM 供给。

压力也已从数据中心蔓延至消费端。Xbox 首席执行官 Asha Sharma 公开表示，过去两年间内存成本上涨约五倍，已影响游戏主机供应；苹果也相继对 iPhone、Mac、iPad 等产品调价。摩根士丹利分析师 Shawn Kim 团队直言，内存价格飙升正演变为数字经济的全面风险，「从 AI 基础设施的瓶颈，蔓延至硬件利润率、设备可负担性、云成本乃至通胀与政策层面」。

AMD：以 AI 预测调度实现内存分层

面对 DRAM 的昂贵与稀缺，行业玩家开始另辟蹊径，不再单纯堆硬件，而是用技术手段减少对 DRAM 的依赖。AMD 选择了最轻量的软件切入路径：2026 年 6 月宣布收购内存优化厂商 MEXT，引入基于 AI 的内存分层技术。

MEXT 的核心产品是预测内存引擎（Predictive Memory Engine），一套完全基于软件的内存分层方案：

以内存页为粒度持续监测应用访问模式，自动将低频冷数据迁移到 NAND 闪存（闪存每比特成本仅约为 DRAM 的 1/55）；
通过 AI 模型学习工作负载访问规律，预测即将被调用的数据页，在应用发起请求前就主动将其预取回 DRAM；
对操作系统和上层应用完全透明，无需修改业务代码，也不需要新增专用硬件。

官方数据显示，该方案可将系统有效内存容量提升 2 至 4 倍，基础设施整体成本下降约 50%；在 Neo4j 图数据库、EDA 仿真、影视渲染等场景中，DRAM 与闪存 1:1 配比的配置可达纯 DRAM 配置约 95% 的吞吐量。收购消息公布当日，AMD 股价盘中上涨近 7%。

Apple：把 200 亿参数模型「存进」闪存

当数据中心为 DRAM 成本头疼，消费端也面临同样约束——手机等终端的 DRAM 容量极为有限，却要承载端侧大模型推理。苹果的解法是让大模型常驻闪存、按需加载到内存。

苹果最新的 AFM 3 Core Advanced 是一款 200 亿参数的端侧大模型，若按传统方式全部加载到 DRAM，远超消费级设备上限。苹果采用稀疏激活架构破解难题：

完整模型存放于 NAND 闪存；
推理时按提示词粒度路由，一次性选定本次所需专家模块，仅将 10 亿至 40 亿参数的工作集调入 DRAM；
结合指令级剪枝、Transformer 层精简等优化，将 200 亿参数模型的 DRAM 峰值占用控制在 2GB 至 8GB 区间。

这套思路早在 2024 年苹果发表的《LLM in a Flash》论文中已有系统验证，可在 CPU 和 GPU 上分别实现比朴素加载快 4–5 倍和 20–25 倍的推理速度。当 DRAM 涨价从产业端传导至消费电子，这套方案既支撑了端侧 AI 体验，也降低了对大容量 DRAM 的依赖。

Marvell：硬件压缩加 CXL，给物理内存扩容

如果说 AMD 与苹果走的是软件与架构优化路线，Marvell 则选择硬件层面的突破。2026 年 6 月，Marvell 发布 Structera 系列 CXL 控制器——Structera X（内存扩展控制器）与 Structera A（近内存加速器），两款芯片均内置自研 CDB 硬件压缩模块。

数据写入 DRAM 时，CDB 模块通过定制化 LZ4 无损算法实时压缩，读取时同步解压，整个过程在内存链路中独立完成，不占用主机 CPU 算力，对上层应用完全透明。根据数据类型不同，1GB 物理 DRAM 可发挥 2 至 3.64 倍的等效逻辑容量。

附加价值同样可观：

Structera X 控制器支持 DDR4 内存接入，可将退役 DDR4 纳入 CXL 内存池，减少对昂贵 DDR5 的新增采购；
通过 CXL 协议打破单 CPU 对内存的独占限制，实现多服务器内存池化。

按当前 DDR5 现货价计算，一个 12TB 内存池若采用 3 倍压缩比，物理 DRAM 采购量可缩减三分之二，单池节省超 30 万美元。Structera 也是业内首款量产的搭载硬件内联压缩的 CXL 控制器，方案已提交 OCP 标准化。

闪迪：高带宽闪存，让 NAND 紧贴 GPU

闪迪的方案更为激进——从封装层面重构 AI 芯片的内存架构。闪迪正联合 SK 海力士推动高带宽闪存（HBF）标准化，试图在 HBM 与 SSD 之间建立全新存储层级。

其专利方案提出「GPU 下的 NAND」架构：将高容量 NAND 闪存堆叠在 GPU 或 AI 加速器正下方，周围环绕 HBM 堆叠，通过缩短数据传输距离提升闪存访问带宽。HBF 与 HBM4 物理兼容，容量可达同体积 HBM 的 8 至 16 倍，主打长上下文推理、KV 缓存、模型权重流式加载等读取密集型场景。

2026 年 2 月，闪迪与 SK 海力士正式启动 HBF 规范标准化联盟，计划 2026 年下半年推出首批样品，2027 年初应用于 AI 推理设备。目标是构建三级内存架构：HBM 负责超低延迟即时计算，HBF 承接大容量、高吞吐读取数据，SSD 承载冷存储。据韩国新荣证券预计，HBF 市场有望在 2027 年形成，到 2030 年增长至 120 亿美元规模。

从 3D XPoint 折戟看存储分层的前车之鉴

用闪存扩展主内存并非新鲜事。早在 2015 年，英特尔与美光就联合推出 3D XPoint 存储技术，试图在 DRAM 与 NAND 之间构建新层级。但制程研发滞后让成本追平 DRAM、性能仅比普通闪存快数倍，加之英特尔将其绑定自家 Xeon 的封闭策略，使其始终未能进入主流市场，项目最终终止，英特尔闪存业务也被出售给 SK 海力士。

历史教训表明，存储分层技术的成败，既取决于性能与成本的平衡，也取决于生态开放程度。在 DRAM 价格高企、HBM 持续挤占标准内存产能的背景下，AMD、Apple、Marvell、闪迪分别从软件调度、模型架构、硬件压缩、封装创新四个维度给出了各自的答案，AI 推理的内存层级正在被重构：低频 KV 缓存、模型权重及端侧数据将逐步从高价 HBM/DRAM 下沉至 NAND Flash/SSD 层，形成多层次存储架构。这一转变也意味着，NAND 原厂、内存池化方案商与存算一体初创公司，将在新一轮产业周期中获得更多关注。