DeepSeek 完成 510 亿融资，大规模招人建数据中心冲 AGI

6 月 29 日晚，DeepSeek 正式宣布 V4 正式版将于 7 月中旬上线，并将同步引入峰谷定价机制。与此同时，这家此前坚持「不融资、不上市、不商业化」的大模型公司在过去两周密集落子：完成 510 亿元首轮融资、估值近 4000 亿元，启动大规模招聘，并联合北京大学发布 DSpark 推理加速论文。资本与技术的双重叠加，标志着 DeepSeek 正从「天才实验室」向重资产、重组织的 AI 公司加速转型。

破例首轮融资，规模达 510 亿元

6 月 16 日，DeepSeek 宣布完成成立以来首轮外部融资，募资总额 510 亿元，估值接近 4000 亿元，一举打破了创始人梁文锋长期立下的「不融资、不上市、不商业化」原则。

融资之前，DeepSeek 的底气来自其背后的量化私募基金幻方量化。2025 年幻方量化年化收益率达 56.55%，管理规模超过 700 亿元，使 DeepSeek 不必依赖外部资本也能维持运转。然而随着大模型竞争进入白热化阶段，单一资金来源已难以支撑长期投入。

促使梁文锋改变态度的另一关键因素是人才争夺。已在港股上市的「大模型第一股」智谱截至 6 月 30 日总市值接近万亿港元，MiniMax 市值也超过 1300 亿港元，员工身家随估值水涨船高。相比之下，DeepSeek 员工手中的期权缺乏外部估值参考，激励效果有限。接近 DeepSeek 的资深从业者直言：「不融资，员工手上就算有期权也不会涨，核心人才肯定留不住。」

大规模扩招：从 33 个岗位到组织补齐

融资到位后，DeepSeek 的招聘节奏明显加快。6 月 25 日，团队在多个平台同步发布招聘信息，涵盖算法、研发、运维、产品、数据工程师及 HR、法务、财务等职能部门，共 7 大类、33 个岗位，工作地点包括北京和杭州，所有岗位均接受实习。

值得关注的是，HR、法务、财务、采购、行政等职能部门也在此次扩招范围内。这一信号表明 DeepSeek 正从「产品驱动」迈向「组织驱动」，补齐一家科技公司所必需的组织架构能力。招聘工作的实际负责人是今年 3 月加入团队的梁文锋浙大校友、Harness 团队新负责人崔添翼，他在社交平台主动下场招人，并回应「卡学历、卡豆包经历」等网络传闻，呈现出与公司以往低调风格不同的姿态。

自建数据中心，迈入重资产竞赛

招聘清单中的另一亮点是 IDC（互联网数据中心）团队。自 4 月中旬起，DeepSeek 已在内蒙古乌兰察布发布首批数据中心岗位，包括高级运维工程师与高级交付经理；6 月又新增「IDC 设计规划工程师」。从运维、交付到设计规划，DeepSeek 的人才布局已从模型层延伸至算力基础设施层。

这一转向呼应了行业大趋势。美国科技巨头 Alphabet、亚马逊、Meta 与微软预计今年将合计投入约 6500 亿美元扩大 AI 基础设施；Anthropic 已披露其数据中心容量租赁将向 SpaceX 支付约每月 12.5 亿美元。工信部信息通信经济专家委员会委员盘和林指出：「大模型企业融资已是大势所趋，谷歌也融资 800 亿美元，行业已进入重资本阶段。」

在海外先进算力出口受限的背景下，DeepSeek 的算力建设将主要由国产芯片驱动。V4 发布时，DeepSeek 已在官方页面和技术报告中提及对国产算力的探索；5 月底华为提出的「韬（τ）定律」也在试图以全栈协同优化突破算力瓶颈。

DSpark 论文与持续技术输出

6 月 27 日，融资完成仅十几天后，DeepSeek 联合北京大学在 GitHub 更新了论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》，创始人梁文锋同样位列作者。

DSpark 并非新模型，而是在 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 基础上新增的推测解码模块，其核心目标是在工程落地层面减少线上推理中的无效校验。论文数据显示「在不改变底层模型架构的情况下将生成速度提高了 60–85%」。对每天处理海量 API 请求的 DeepSeek 而言，这意味着显著的算力成本压缩。

近两年，DeepSeek 公开发表的核心技术论文约 27 篇，研究方向覆盖 MoE、强化学习、代码大模型、数学推理与多模态等，几乎对应着其每一代关键模型与技术突破。

进入 AGI 的下半场

2024 年梁文锋接受《暗涌Waves》采访时曾明确表态：「我们做的就是 AGI。语言大模型可能是通往 AGI 的必经之路。」6 月 25 日的招聘公告同样写道：「当今人类正处于 AGI 的前夜。」

从融资到组织补齐，从算力底座到推理加速，DeepSeek 正在为下一阶段的长期竞赛积攒资源。但伴随而来的是一系列未知数：如何在扩招后保持小团队的决策敏捷，如何让重资产投入转化为持续的模型领先，如何在付费端与企业场景中证明工程稳定性——这些将是 DeepSeek「下半场」必须回答的问题。