DeepSeek 又放大招：开源 DSpark 与 V4 提速版，梁文锋自掏 200 亿守开源路线

这个周末，DeepSeek 再次以「全员开源」的方式高调出场：把推理加速模块 DSpark 与配套的训练/评测工具箱 DeepSpec（含论文与三种算法）一并丢上 GitHub，又把挂载了提速模块的 V4 权重——V4-Pro-DSpark 与 V4-Flash-DSpark——同步发布到 Hugging Face，全部采用最宽松的 MIT 协议，免费可商用。海外长期跟踪中国大模型的博主 Teortaxes 直言，这是「出于浩瀚的慷慨」。事件背后，是梁文锋为 DeepSeek 设计的开源战略与个人资本的全面押注。

开源诚意：与全球大厂的对比

DeepSeek 的「大方」，放在全球大厂坐标系下尤其显眼。OpenAI 名字里写着「Open」，2023 年发布 GPT-4 时的技术报告却明确写「出于竞争考虑，不透露任何技术细节」；直到 2025 年 8 月，眼看中国免费模型即将成为全球程序员默认选项，才匆忙放出 gpt-oss 救场，且仅开源模型本身，训练代码与数据仍藏着掖着。奥特曼本人后来承认「之前站在了历史错误的一边」。

Meta 的 Llama 看似开放，许可证却设下月活超 7 亿需另行付费的「小字陷阱」，被开源促进会 OSI 两次公开点名，称其是「open washing」（假开源）。Anthropic 至今未放出任何开放模型，CEO 阿莫代伊还公开主张对华 AI 芯片出口管制。

而 DeepSeek 此次更进一步：不再只给「最终答案」（开放权重），而是把「让模型答得更快」的训练方法也教给业界。V3 给出模型本身，R1 给出强化学习推理训练报告与 6 个蒸馏小模型，这次则把推测解码（speculative decoding）这类核心加速技术一并开放——权重、全套方法论，层层递进。严格按 OSI 标准，DeepSeek 训练原始数据并未完全公开，但与「只露一条门缝」的同行相比，差距已属量级。

慷慨背后的商业算盘

白送方法论、把价格砸到地板，并不意味着亏本。DeepSeek 2025 年 2 月在《DeepSeek-V3/R1 推理系统概览》中测算：若每一次调用都按最贵档计费，理论利润率可达 545%。实际收入远低于此（网页版与 App 免费、便宜模型是主力、深夜自动打折），但可见其定价留有巨大操作空间。

这与字节豆包、阿里通义的低价策略形成本质差异：后两者是「以模型带云」——亏本卖接口，把客户导入自家云服务再赚回来；DeepSeek 没有云生意要养，纯粹是因为成本压得住、愿意把模型当成水电一类的公共品。同样便宜，一个是鱼饵，一个是效率与理想的副产品。

DeepSeek 的战略目标也不是接口费本身，而是让整个行业长在它的地基上。梁文锋曾说：「我们只负责基础模型和前沿创新，其它公司在 DeepSeek 基础上做应用就行。」研究机构 SemiAnalysis 的数据印证了这一点：DeepSeek 官方渠道用量在下降，但全球其它平台「转售」其模型的用量暴涨近 20 倍。2025 年 1 月 R1 发布当日，英伟达股价暴跌，单日蒸发约 5890 亿美元，创美股历史纪录——投资人「搞 AI 必须无限烧钱买卡」的信仰被一击粉碎。

自掏 200 亿：把开源这条路焊死

2025 年 4 月，DeepSeek 完成成立以来首次私募融资，规模约 510 亿元，估值约 4000 亿元，腾讯、宁德时代、网易、京东等参与。融资设计极具特色：

梁文锋个人出资约 200 亿元，是本轮最大出资方，接近腾讯的两倍，且用的是个人资金而非幻方资产；
外部投资人资金需先进入梁文锋亲自管理的资金池，没有投票权，且须锁定 5 年不得退出，相当于一笔五年期存款（国家队 AI 产业基金除外）；
梁文锋个人直接持股从约 1% 拉升至约 34%，牢牢握住接近 100% 的表决权。

他在投资人见面会上把丑话说在前头：「把突破性研究放在赚钱之前」「继续做开源，奔向 AGI」。这套设计的核心目的是提前排除一种风险：未来某天，财务投资人逼宫、要求关闭开源、转向收割。梁文锋用 200 亿现金和特殊的治理结构，把这条路焊死了。

草根量化出身，把炒股算力变成 AI 算力

梁文锋 1985 年生于广东湛江的小村，父母是乡村教师，浙大电子信息工程本科、机器视觉硕士出身。真正让他发家的是炒股：2008 年金融危机时，他揣着 8 万本金，写程序破解炒股软件接口、让电脑自动找规律下单，七年里以年均超 100% 的复合收益滚成亿元富豪。2015 年创立幻方量化，规模一度攀至约 1000 亿元，跻身国内量化「四大天王」。

量化拼的是毫秒级反应与算力。幻方早在 2020 年「萤火一号」、2021 年「萤火二号」期间就囤下上万张英伟达顶级 A100 显卡，是全亚洲最早攒下如此规模算力的公司之一——这些型号后来都被美国列入对华禁售清单。原本用于炒股的算力，在 2022 年底 ChatGPT 引爆全球大模型竞赛后，变成了稀缺资源。2023 年 4 月梁文锋宣布进军 AGI，7 月成立 DeepSeek，把幻方的算力、利润与机器学习团队整建制转向大模型。

结语：清醒的理想主义者

从推理加速模块 DSpark、训练工具箱 DeepSpec，到 V4 提速版权重的同步开源，再到自掏 200 亿、锁定控制权守住开源路线——DeepSeek 的每一步都把「开放」从口号变成具体动作。梁文锋本人则把这件事说得很清楚：「在颠覆性的技术面前，闭源形成的护城河是短暂的。」「开源更像一个文化行为，而非商业行为，给予其实是一种额外的荣誉。」免费送出方法论、把价格打到全行业都难受、自己掏 200 亿把方向盘焊死——他赌的不是哪一代模型一时的输赢，而是「开放」这条路本身能不能走通。圣人不圣人不重要，一个清醒的理想主义者，本来就可以一边把家底摊给所有人，一边把算盘打得比谁都精。