DeepSeek 完成 510 亿融资,大规模招人建数据中心冲 AGI
DeepSeek 完成首轮 510 亿融资、估值近 4000 亿元,破例打破不融资原则;同步启动 33 个岗位招聘与国产…
6 月 29 日晚,DeepSeek 正式宣布 V4 正式版将于 7 月中旬上线,并将同步引入峰谷定价机制。与此同时,这家此前坚持「不融资、不上市、不商业化」的大模型公司在过去两周密集落子:完成 510 亿元首轮融资、估值近 4000 亿元,启动大规模招聘,并联合北京大学发布 DSpark 推理加速论文。资本与技术的双重叠加,标志着 DeepSeek 正从「天才实验室」向重资产、重组织的 AI 公司加速转型。
破例首轮融资,规模达 510 亿元
6 月 16 日,DeepSeek 宣布完成成立以来首轮外部融资,募资总额 510 亿元,估值接近 4000 亿元,一举打破了创始人梁文锋长期立下的「不融资、不上市、不商业化」原则。
融资之前,DeepSeek 的底气来自其背后的量化私募基金幻方量化。2025 年幻方量化年化收益率达 56.55%,管理规模超过 700 亿元,使 DeepSeek 不必依赖外部资本也能维持运转。然而随着大模型竞争进入白热化阶段,单一资金来源已难以支撑长期投入。
促使梁文锋改变态度的另一关键因素是人才争夺。已在港股上市的「大模型第一股」智谱截至 6 月 30 日总市值接近万亿港元,MiniMax 市值也超过 1300 亿港元,员工身家随估值水涨船高。相比之下,DeepSeek 员工手中的期权缺乏外部估值参考,激励效果有限。接近 DeepSeek 的资深从业者直言:「不融资,员工手上就算有期权也不会涨,核心人才肯定留不住。」
大规模扩招:从 33 个岗位到组织补齐
融资到位后,DeepSeek 的招聘节奏明显加快。6 月 25 日,团队在多个平台同步发布招聘信息,涵盖算法、研发、运维、产品、数据工程师及 HR、法务、财务等职能部门,共 7 大类、33 个岗位,工作地点包括北京和杭州,所有岗位均接受实习。
值得关注的是,HR、法务、财务、采购、行政等职能部门也在此次扩招范围内。这一信号表明 DeepSeek 正从「产品驱动」迈向「组织驱动」,补齐一家科技公司所必需的组织架构能力。招聘工作的实际负责人是今年 3 月加入团队的梁文锋浙大校友、Harness 团队新负责人崔添翼,他在社交平台主动下场招人,并回应「卡学历、卡豆包经历」等网络传闻,呈现出与公司以往低调风格不同的姿态。
自建数据中心,迈入重资产竞赛
招聘清单中的另一亮点是 IDC(互联网数据中心)团队。自 4 月中旬起,DeepSeek 已在内蒙古乌兰察布发布首批数据中心岗位,包括高级运维工程师与高级交付经理;6 月又新增「IDC 设计规划工程师」。从运维、交付到设计规划,DeepSeek 的人才布局已从模型层延伸至算力基础设施层。
这一转向呼应了行业大趋势。美国科技巨头 Alphabet、亚马逊、Meta 与微软预计今年将合计投入约 6500 亿美元扩大 AI 基础设施;Anthropic 已披露其数据中心容量租赁将向 SpaceX 支付约每月 12.5 亿美元。工信部信息通信经济专家委员会委员盘和林指出:「大模型企业融资已是大势所趋,谷歌也融资 800 亿美元,行业已进入重资本阶段。」
在海外先进算力出口受限的背景下,DeepSeek 的算力建设将主要由国产芯片驱动。V4 发布时,DeepSeek 已在官方页面和技术报告中提及对国产算力的探索;5 月底华为提出的「韬(τ)定律」也在试图以全栈协同优化突破算力瓶颈。
DSpark 论文与持续技术输出
6 月 27 日,融资完成仅十几天后,DeepSeek 联合北京大学在 GitHub 更新了论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,创始人梁文锋同样位列作者。
DSpark 并非新模型,而是在 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 基础上新增的推测解码模块,其核心目标是在工程落地层面减少线上推理中的无效校验。论文数据显示「在不改变底层模型架构的情况下将生成速度提高了 60–85%」。对每天处理海量 API 请求的 DeepSeek 而言,这意味着显著的算力成本压缩。
近两年,DeepSeek 公开发表的核心技术论文约 27 篇,研究方向覆盖 MoE、强化学习、代码大模型、数学推理与多模态等,几乎对应着其每一代关键模型与技术突破。
进入 AGI 的下半场
2024 年梁文锋接受《暗涌Waves》采访时曾明确表态:「我们做的就是 AGI。语言大模型可能是通往 AGI 的必经之路。」6 月 25 日的招聘公告同样写道:「当今人类正处于 AGI 的前夜。」
从融资到组织补齐,从算力底座到推理加速,DeepSeek 正在为下一阶段的长期竞赛积攒资源。但伴随而来的是一系列未知数:如何在扩招后保持小团队的决策敏捷,如何让重资产投入转化为持续的模型领先,如何在付费端与企业场景中证明工程稳定性——这些将是 DeepSeek「下半场」必须回答的问题。
