Claude Mythos 刺激 DeepSeek 融资 74 亿美元
The Information 爆料:梁文锋看到 Claude Mythos 后决定融资,融资金额 74 亿美元,团队至…
- 重要性
- 78
- 新颖性
- 72
- 影响面
- 72
- 可信度
- 55
- 实质性
- 72
DeepSeek 罕见的 74 亿美元融资有了更清晰的导火索:Anthropic 旗下 Claude Mythos 的能力让创始人梁文锋意识到,「不储备弹药根本没法打下去了」。量子位转载 The Information 独家报道,并补充了融资后的人员扩张与芯片适配等更多细节。
融资导火索:Claude Mythos 的冲击
Anthropic 今年 4 月发布 Claude Mythos 的首个预览版本后不久,DeepSeek 融资的消息首次传出,时间线高度吻合。该模型被业内视为通过海量算力和数据训练出超强能力的代表,直接触动了梁文锋对竞争烈度的判断。
融资完成后,DeepSeek 本周四发布了一则公开声明:所有部门招人「至少翻倍」,覆盖 AI 系统开发、基础设施、产品开发和深度学习研究四大方向。公司目前全员工约 300 人,其中负责将模型转化为自主 AI 智能体的核心部门 Harness 团队已进入每天面试的节奏。Harness 负责人崔添翼今年 3 月才从 Jane Street 加入,本月初在 X 平台透露了这一招聘强度。
转型代价:15 个月空窗与芯片适配
DeepSeek 的训练和部署系统长期围绕英伟达 CUDA 软件栈搭建。适配华为芯片意味着工程师必须重写底层软件,这一代价直接导致 DeepSeek 长达 15 个月没有发布新一代模型。在其他顶级实验室两三个月就迭代一次的节奏下,这个空窗期格外扎眼,也使其错过去年下半年由 Anthropic Claude Code 掀起的编程工具热潮。
梁文锋在路演中对投资人表达了不同看法:编程工具和 AI 聊天机器人都只是 AI 进化中的临时产物,重注押在短期产品上会偏离通往 AGI 的终极目标。他相信华为芯片几年内就能追上英伟达水平,DeepSeek 应率先完成适配。事实上,华为去年得知 DeepSeek 在私下测试自家芯片后,双方才开始直接合作。
梁文锋的底色与战略不变项
早在 2023 年,梁文锋就曾与投资人接触,但当对方发现 DeepSeek 只做深度研究和科学探索、没有任何商业化或产品路线图时,纷纷退出。最终梁文锋自掏腰包养活这个实验室,一养就是三年。
此次 74 亿美元融资中,梁文锋个人出资约 200 亿人民币(合 30 亿美元),占总额的五分之二。融资完成后,公司设立员工持股计划,按实际估值分配股份。梁文锋告诉身边人,战略不会变:继续开源、保持低价、专注 AGI。他把 AGI 定义为机器在理解、推理、学习、规划和适应等广泛任务上达到人类水平。他还强调,AI 不应该被少数人控制。
DeepSeek 目前是唯一一家将所有模型底层代码完全开源的主要 AI 实验室。在美国开发者群体中,其影响力正在快速提升。今年 4 月发布的旗舰模型 V4,5 月在 Vercel 的 AI Gateway 平台上 token 用量份额从不到 1% 飙升至 17%,一个月内成为该平台仅次于 Anthropic 与 Google 的第三大模型。轻量版 V4 Flash 定价相较 Anthropic 主流模型便宜 20 到 50 倍,这种增长在 6 月仍在持续。
