AI 算力逼近极限,液冷成芯片散热新基建
AI 芯片功耗突破 1000W、风冷触及物理上限,液冷正从封装到数据中心全链路替代风冷,重塑半导体产业链。
当单颗 AI 加速器功耗逼近 1000 W、单个机架功率接近 1 兆瓦时,空气冷却的物理极限已被触及。施耐德电气总裁直言,「一旦单芯片功耗超过某个阈值,液冷就不再是可选项,而是必需品。」围绕散热,半导体产业正经历一次从芯片内部到数据中心外墙的全链路重构。
芯片级突破:KAIST 的歧管微通道方案
6 月 16 日,韩国科学技术院(KAIST)团队发表论文,提出一种直接在硅片内部雕刻「歧管微通道」(manifold microchannel)的液冷方案。该结构通过在芯片表面均匀分布多个微型入口与出口,大幅缩短冷却流体的传输距离,从而显著降低流阻和泵送压力。
- 冷却性能系数(COP)达 106,000,是 2020 年《Nature》所记录世界纪录的 10 倍;
- 在每平方厘米 2000 W 的极端热负荷下,仍能用室温水将芯片温度控制在 100°C 以下;
- 制造工艺在 350°C 以下完成,兼容现有商业半导体晶圆代工产线。
据 Fact.MR 预测,全球微流控芯片冷却市场规模将从 2025 年的 3.843 亿美元增至 2036 年的 28.6 亿美元,复合年增长率约 20%。
封装级热防御:HBM 三巨头的技术路线
HBM 从 HBM3E 向 HBM5 演进,堆叠层数预计达 20 层左右,热量积聚已成为性能瓶颈。存储三巨头正围绕封装级热管理展开角逐:
- SK 海力士:5 月 27 日发布「iHBM」方案,将硅基绝缘散热元件(ICE)集成到 HBM 堆栈与 GPU 之间的 D2D PHY 接口中,可降低热阻 30%,将应用于 HBM5 等下一代产品;
- 三星:在 COMPUTEX 2026 上展示搭载 HPB 技术的 HBM5 模型,在 D2D PHY 区域引入独立硅基热路径,铜基 HPB 已在 Exynos 2600 上实现 16% 的热阻下降;
- 美光:聚焦低功耗 HBM 设计,利用硅通孔(TSV)沟槽冷却与电气被动冷却 TSV 构建垂直散热通道,不占用额外裸片面积。
机架级革命:英伟达 Rubin 100% 全液冷
2026 年 6 月 21 日,英伟达在官方博客披露新一代 Rubin 平台的散热架构,这也是全球首个 100% 全液冷 AI 计算平台。在 Rubin 服务器中,GPU、CPU 以及全部网络组件均由闭环液冷系统冷却,彻底取消风扇。
- 冷却液采用 75% 水 + 25% 丙二醇,入口温度推高至 45°C,流出温度约 55°C;
- 据行业估算,冷水机温度每提高 1°C,冷却能耗成本可降低约 4%;
- 50 兆瓦超大规模数据中心转向该方案后,每年可节省超过 400 万美元的冷却与水资源成本;
- 机架密度大幅提升,原本占 6 个机架单元的系统只需 2 个单元,噪音从 85 分贝以上降至几乎无声。
英伟达数据中心冷却与基础设施总监 Ali Heydari 表示,DSX 参考设计已实现零水消耗,仅在部分气候条件下约 1% 的时间需要冷水机组介入。戴尔、Supermicro 等 OEM 已迅速跟进,PowerEdge XE8812 可在单机架容纳 144 颗 GPU、功率超 300 kW。
初创公司抢滩,资本市场热烈回应
液冷赛道的资本热度同步攀升。Accelsius 完成江森自控领投的 6500 万美元 B 轮融资,其 NeuCool 两相直液冷平台单插槽冷却能力超 4500 W;Omen AI 在 6 月底完成 Nava Ventures 领投的 3100 万美元 A 轮融资,用微型光谱仪配合 AI 实时监测冷却液化学成分,提前预警细菌与设备磨损。二级市场上,Rubin 液冷细节发布后传统 HVAC 股票应声下跌,Vertiv、施耐德电气则持续走高,BNP Paribas 在 6 月研报中将 Vertiv 与 Eaton 列为 AI 数据中心冷却首选标的。
边界之外的隐忧
液冷并非万能药。芝加哥大学教授 Andrew Chien 指出,英伟达 45°C 闭环系统的「零水消耗」仅指数据中心物理边界以内;据 Xylem 与 Global Water Intelligence 分析,到 2050 年,发电厂将消耗 AI 新增水资源需求的 54%,半导体制造占 42%,冷却环节仅占约 4%。此外,亚利桑那、得克萨斯、新加坡等炎热地区在最热时段仍需依赖机械冷却,而新增 AI 数据中心恰恰集中在这些水资源紧张区域。浸没式冷却虽可将 PUE 降至 1.05(如 KDDI 大阪堺市数据中心),但维护复杂、前期资本支出高,对老旧机房改造难度极大。经济学中的「杰文斯悖论」同样适用:散热成本下降,反而可能刺激更多、更密集的算力部署。
结语
芯片冷却已从边缘工程支持环节跃升为 AI 基础设施的核心战略要素。从 KAIST 的微通道创新,到 SK 海力士与三星的封装级热防御,再到英伟达主导的机架级全液冷,一条清晰的技术演进路线已浮现:冷却系统正不断向热源——硅片本身——逼近。热管理正成为 AI 时代的新摩尔定律,定义着算力增长的物理边界与商业天花板。
