DeepSeek 又放大招:开源 DSpark 与 V4 提速版,梁文锋自掏 200 亿守开源路线
DeepSeek 开源推理加速方案 DSpark 与训练工具箱 DeepSeek,加挂提速模块的 V4 权重同步上线;创…
这个周末,DeepSeek 再次以「全员开源」的方式高调出场:把推理加速模块 DSpark 与配套的训练/评测工具箱 DeepSpec(含论文与三种算法)一并丢上 GitHub,又把挂载了提速模块的 V4 权重——V4-Pro-DSpark 与 V4-Flash-DSpark——同步发布到 Hugging Face,全部采用最宽松的 MIT 协议,免费可商用。海外长期跟踪中国大模型的博主 Teortaxes 直言,这是「出于浩瀚的慷慨」。事件背后,是梁文锋为 DeepSeek 设计的开源战略与个人资本的全面押注。
开源诚意:与全球大厂的对比
DeepSeek 的「大方」,放在全球大厂坐标系下尤其显眼。OpenAI 名字里写着「Open」,2023 年发布 GPT-4 时的技术报告却明确写「出于竞争考虑,不透露任何技术细节」;直到 2025 年 8 月,眼看中国免费模型即将成为全球程序员默认选项,才匆忙放出 gpt-oss 救场,且仅开源模型本身,训练代码与数据仍藏着掖着。奥特曼本人后来承认「之前站在了历史错误的一边」。
Meta 的 Llama 看似开放,许可证却设下月活超 7 亿需另行付费的「小字陷阱」,被开源促进会 OSI 两次公开点名,称其是「open washing」(假开源)。Anthropic 至今未放出任何开放模型,CEO 阿莫代伊还公开主张对华 AI 芯片出口管制。
而 DeepSeek 此次更进一步:不再只给「最终答案」(开放权重),而是把「让模型答得更快」的训练方法也教给业界。V3 给出模型本身,R1 给出强化学习推理训练报告与 6 个蒸馏小模型,这次则把推测解码(speculative decoding)这类核心加速技术一并开放——权重、全套方法论,层层递进。严格按 OSI 标准,DeepSeek 训练原始数据并未完全公开,但与「只露一条门缝」的同行相比,差距已属量级。
慷慨背后的商业算盘
白送方法论、把价格砸到地板,并不意味着亏本。DeepSeek 2025 年 2 月在《DeepSeek-V3/R1 推理系统概览》中测算:若每一次调用都按最贵档计费,理论利润率可达 545%。实际收入远低于此(网页版与 App 免费、便宜模型是主力、深夜自动打折),但可见其定价留有巨大操作空间。
这与字节豆包、阿里通义的低价策略形成本质差异:后两者是「以模型带云」——亏本卖接口,把客户导入自家云服务再赚回来;DeepSeek 没有云生意要养,纯粹是因为成本压得住、愿意把模型当成水电一类的公共品。同样便宜,一个是鱼饵,一个是效率与理想的副产品。
DeepSeek 的战略目标也不是接口费本身,而是让整个行业长在它的地基上。梁文锋曾说:「我们只负责基础模型和前沿创新,其它公司在 DeepSeek 基础上做应用就行。」研究机构 SemiAnalysis 的数据印证了这一点:DeepSeek 官方渠道用量在下降,但全球其它平台「转售」其模型的用量暴涨近 20 倍。2025 年 1 月 R1 发布当日,英伟达股价暴跌,单日蒸发约 5890 亿美元,创美股历史纪录——投资人「搞 AI 必须无限烧钱买卡」的信仰被一击粉碎。
自掏 200 亿:把开源这条路焊死
2025 年 4 月,DeepSeek 完成成立以来首次私募融资,规模约 510 亿元,估值约 4000 亿元,腾讯、宁德时代、网易、京东等参与。融资设计极具特色:
- 梁文锋个人出资约 200 亿元,是本轮最大出资方,接近腾讯的两倍,且用的是个人资金而非幻方资产;
- 外部投资人资金需先进入梁文锋亲自管理的资金池,没有投票权,且须锁定 5 年不得退出,相当于一笔五年期存款(国家队 AI 产业基金除外);
- 梁文锋个人直接持股从约 1% 拉升至约 34%,牢牢握住接近 100% 的表决权。
他在投资人见面会上把丑话说在前头:「把突破性研究放在赚钱之前」「继续做开源,奔向 AGI」。这套设计的核心目的是提前排除一种风险:未来某天,财务投资人逼宫、要求关闭开源、转向收割。梁文锋用 200 亿现金和特殊的治理结构,把这条路焊死了。
草根量化出身,把炒股算力变成 AI 算力
梁文锋 1985 年生于广东湛江的小村,父母是乡村教师,浙大电子信息工程本科、机器视觉硕士出身。真正让他发家的是炒股:2008 年金融危机时,他揣着 8 万本金,写程序破解炒股软件接口、让电脑自动找规律下单,七年里以年均超 100% 的复合收益滚成亿元富豪。2015 年创立幻方量化,规模一度攀至约 1000 亿元,跻身国内量化「四大天王」。
量化拼的是毫秒级反应与算力。幻方早在 2020 年「萤火一号」、2021 年「萤火二号」期间就囤下上万张英伟达顶级 A100 显卡,是全亚洲最早攒下如此规模算力的公司之一——这些型号后来都被美国列入对华禁售清单。原本用于炒股的算力,在 2022 年底 ChatGPT 引爆全球大模型竞赛后,变成了稀缺资源。2023 年 4 月梁文锋宣布进军 AGI,7 月成立 DeepSeek,把幻方的算力、利润与机器学习团队整建制转向大模型。
结语:清醒的理想主义者
从推理加速模块 DSpark、训练工具箱 DeepSpec,到 V4 提速版权重的同步开源,再到自掏 200 亿、锁定控制权守住开源路线——DeepSeek 的每一步都把「开放」从口号变成具体动作。梁文锋本人则把这件事说得很清楚:「在颠覆性的技术面前,闭源形成的护城河是短暂的。」「开源更像一个文化行为,而非商业行为,给予其实是一种额外的荣誉。」免费送出方法论、把价格打到全行业都难受、自己掏 200 亿把方向盘焊死——他赌的不是哪一代模型一时的输赢,而是「开放」这条路本身能不能走通。圣人不圣人不重要,一个清醒的理想主义者,本来就可以一边把家底摊给所有人,一边把算盘打得比谁都精。
