桃子桃子快讯
返回首页
行业动态

Anthropic 接洽三星自研芯片,AI 战火延至供应链

在 OpenAI 公布首款推理芯片 Jalapeño 后,Anthropic 也被曝与三星探讨自研芯片合作,头部大模型公…

2026.07.03 · 周五6 分钟阅读

OpenAI 在 6 月底把首款自研推理芯片 Jalapeño 推到台前后,Anthropic 也被曝开始与三星接洽,探讨围绕自研 AI 芯片展开合作。两家最受关注的闭源大模型公司,几乎在同一时间把手伸向了芯片层。不过 Anthropic 的动作仍处在非常早期的阶段,芯片用途、部署方式与最终算力水平均尚未敲定。

Anthropic 与三星的早期接洽

据 TechCrunch 援引 The Information 报道,Anthropic 已与三星就一枚拟议中的芯片进行接触。Anthropic 在对外回应中并未确认与三星的具体合作,但强调包含谷歌 TPU、Amazon Trainium 以及英伟达 GPU 在内的多元化硬件架构,仍是其计算战略的关键支柱。这一表态本身透露了 Anthropic 的真实意图:在多供应商路线之上,叠加一层更深的自定义能力,从「买算力」向「定义算力」演进。

早在今年 4 月,路透社就曾报道 Anthropic 正在探索设计自有 AI 芯片,以应对支撑更先进 AI 系统所需芯片的短缺。当时报道同时强调,Anthropic 也可能最终只采购而非自研,且尚未确定具体设计。从其招聘动作看,方向更加清晰:

  • 今年 2 月,Anthropic 启动「Accelerator Platform」团队负责人招聘,负责把不同代际、不同供应商的芯片接入第一方推理集群,并把底层硬件差异抽象成稳定平台能力。
  • 同期开放的 GPU 效能工程师岗位,则横跨自定义内核开发、分布式系统架构、张量核心优化与数千卡同步调度。

这意味着 Anthropic 当前最确定的能力补强,是围绕 GPU/TPU/Trainium 的软件栈与性能工程,而非传统 ASIC 物理设计。

为什么是现在:算力扩张与商业化压力

Anthropic 的芯片信号出现在算力需求快速膨胀的节点上。今年 4 月,它与谷歌、博通签署协议,获得从 2027 年起上线的多吉瓦级下一代 TPU 容量;同月又与 Amazon 扩大合作,锁定最多 5 GW 用于训练和部署 Claude 的新容量,目前已有超过 100 万颗 Trainium 2 芯片用于训练和服务 Claude。

随着 Claude 进入企业、开发者、编码、知识工作与 Agent 场景,推理请求量持续放大,模型公司越来越被算力成本与供应确定性反向约束。Anthropic 在与 Amazon 的公告中也明确提到,2026 年 Claude 需求加速增长,基础设施可靠性与性能承压。

相比之下,OpenAI 的 Jalapeño 已先行落地。这颗与博通合作设计的芯片被定义为 OpenAI 首款「Intelligence Processor」,从一开始就围绕大语言模型推理设计,而非通用 AI 加速器的改造产物;样片已在实验室运行 GPT-5.3-Codex-Spark 模型,计划年底部署,服务器系统由 Celestica 构建,芯片交由台积电制造。

自研芯片的真实逻辑

头部模型公司自研芯片首先瞄准的并不是训练,而是推理:训练决定模型能力上限,推理决定商业化成本下限。每一次 API 调用、每一次代码生成、每一次 Agent 工具调用、每一次长上下文处理,都会转化为真实的 token 账单。当 AI 产品从「偶尔使用」走向「持续运行」,推理成本将越来越像云计算时代的带宽与存储成本,直接决定产品毛利、响应速度与用户体验。

OpenAI 在介绍 Jalapeño 时也指出,自研芯片的价值在于把对模型架构、推理模式、服务系统、内存访问与网络通信的理解直接写进硬件设计,减少数据移动,让实际利用率更接近理论峰值。

这些动作并不是要「去英伟达」,而是对多供应商策略的升级:

  • 在供应紧张时获得额外产能入口;
  • 把高频推理负载迁移到更贴合自身模型与产品需求的硬件上;
  • 在与云厂商、芯片厂商、代工厂、内存供应商谈判时拥有更多筹码;
  • 让模型路线图与硬件路线图形成长期协同。

供应链层面的深远影响

Anthropic 与三星的接触之所以值得关注,关键在于韩国半导体供应链可能正在被重新绑定。Anthropic 在 H 轮融资公告中,已将美光、三星和 SK 海力士列为「战略基础设施伙伴」;而在三家内存伙伴中,只有三星同时拥有芯片代工业务。韩国媒体《Pulse》指出,外界开始关注三星是否会在内存之外,通过代工业务参与 Anthropic 未来的 AI 芯片制造。

这背后是 AI 芯片越来越无法脱离高带宽内存、先进封装、网络与软件栈单独存在。以 AWS Trainium2 为例:单颗芯片内置 96 GiB HBM、带宽 2.9 TB/s;一台 Trn2 实例集成 16 颗芯片,总计 1.5 TiB HBM 与 46 TB/s 带宽;再通过 NeuronLink 互连扩展到 64 颗芯片的 UltraServer 级别。

而高带宽内存正是当前 AI 基础设施中最稀缺的环节之一。路透社报道称,部分内存价格自 2025 年 2 月以来已翻倍,SK 海力士曾告诉分析师,内存短缺可能持续到 2027 年末;OpenAI 与三星、SK 海力士签署的初步协议显示,「星际之门」项目到 2029 年可能每月需要多达 90 万片晶圆,约为当前全球每月 HBM 产量的两倍。

对三星而言,承接 Anthropic 未来 AI 芯片订单,是缩小与台积电代工份额差距的想象空间——三星目前在全球代工市场占有率约 7%,台积电约 72%。但自研芯片并非捷径:路透社估算设计一颗先进 AI 芯片需约 5 亿美元,且真正落地还要依赖博通的硅实现与网络能力、Celestica 的板卡与机架系统,以及后续规模化生产与数据中心部署。更长期的挑战则在于 AI 模型自身变化过快,今天适合某一代推理模式的定制芯片,可能在下一代模型、更长上下文或新模态架构下,从优势变成包袱。

Anthropic 与三星的接洽尚未落成实质订单,但它释放的信号足够清晰:大模型战争正在打到供应链深处,且会越走越深。

信源