Claude Mythos 刺激 DeepSeek 融资 74 亿美元

DeepSeek 罕见的 74 亿美元融资有了更清晰的导火索：Anthropic 旗下 Claude Mythos 的能力让创始人梁文锋意识到，「不储备弹药根本没法打下去了」。量子位转载 The Information 独家报道，并补充了融资后的人员扩张与芯片适配等更多细节。

融资导火索：Claude Mythos 的冲击

Anthropic 今年 4 月发布 Claude Mythos 的首个预览版本后不久，DeepSeek 融资的消息首次传出，时间线高度吻合。该模型被业内视为通过海量算力和数据训练出超强能力的代表，直接触动了梁文锋对竞争烈度的判断。

融资完成后，DeepSeek 本周四发布了一则公开声明：所有部门招人「至少翻倍」，覆盖 AI 系统开发、基础设施、产品开发和深度学习研究四大方向。公司目前全员工约 300 人，其中负责将模型转化为自主 AI 智能体的核心部门 Harness 团队已进入每天面试的节奏。Harness 负责人崔添翼今年 3 月才从 Jane Street 加入，本月初在 X 平台透露了这一招聘强度。

转型代价：15 个月空窗与芯片适配

DeepSeek 的训练和部署系统长期围绕英伟达 CUDA 软件栈搭建。适配华为芯片意味着工程师必须重写底层软件，这一代价直接导致 DeepSeek 长达 15 个月没有发布新一代模型。在其他顶级实验室两三个月就迭代一次的节奏下，这个空窗期格外扎眼，也使其错过去年下半年由 Anthropic Claude Code 掀起的编程工具热潮。

梁文锋在路演中对投资人表达了不同看法：编程工具和 AI 聊天机器人都只是 AI 进化中的临时产物，重注押在短期产品上会偏离通往 AGI 的终极目标。他相信华为芯片几年内就能追上英伟达水平，DeepSeek 应率先完成适配。事实上，华为去年得知 DeepSeek 在私下测试自家芯片后，双方才开始直接合作。

梁文锋的底色与战略不变项

早在 2023 年，梁文锋就曾与投资人接触，但当对方发现 DeepSeek 只做深度研究和科学探索、没有任何商业化或产品路线图时，纷纷退出。最终梁文锋自掏腰包养活这个实验室，一养就是三年。

此次 74 亿美元融资中，梁文锋个人出资约 200 亿人民币（合 30 亿美元），占总额的五分之二。融资完成后，公司设立员工持股计划，按实际估值分配股份。梁文锋告诉身边人，战略不会变：继续开源、保持低价、专注 AGI。他把 AGI 定义为机器在理解、推理、学习、规划和适应等广泛任务上达到人类水平。他还强调，AI 不应该被少数人控制。

DeepSeek 目前是唯一一家将所有模型底层代码完全开源的主要 AI 实验室。在美国开发者群体中，其影响力正在快速提升。今年 4 月发布的旗舰模型 V4，5 月在 Vercel 的 AI Gateway 平台上 token 用量份额从不到 1% 飙升至 17%，一个月内成为该平台仅次于 Anthropic 与 Google 的第三大模型。轻量版 V4 Flash 定价相较 Anthropic 主流模型便宜 20 到 50 倍，这种增长在 6 月仍在持续。