桃子桃子快讯
返回首页
行业动态

DeepSeek 新技术「DSpark」遭曝光:号称速度大幅超越 MTP

Reddit 用户分享视频称 DeepSeek 推出 DSpark 方案,速度明显优于 MTP,暂无官方确认。

2026.07.03 · 周五3 分钟阅读

近日,Reddit 社区 r/LocalLLaMA 出现一条热帖,引用一段 YouTube 视频称 DeepSeek 推出名为「DSpark」的新方案,性能据称「远远快于 MTP(Multi-Token Prediction)」。发帖者表示这是 DeepSeek 的又一次「重大突破」,但未给出论文、官方博客或基准测试等可验证资料。

事件来源与可信度

截至目前,DSpark 的信息仅停留在两条渠道:

DeepSeek 官方渠道(GitHub、官方推特 / X、论文平台)尚未发布与「DSpark」直接对应的发布说明或技术报告。社区讨论中也没有出现可重复的 benchmark 数据或代码仓库,因此该消息仍属于「社媒首曝、官方未确认」阶段。

MTP 背景简述

MTP(Multi-Token Prediction,多 token 预测)是当前主流的大模型加速方案之一,其思路是让模型在一次前向计算中预测多个 token,再通过校验与回退机制提升推理吞吐。该方法已被 Meta、DeepSeek 等厂商在模型结构层面采用,用于在不显著损失生成质量的前提下提升训练与推理效率。

DSpark 究竟是什么?

目前公开信息极为有限,仅能确认:

  • 名称为「DSpark」,疑似与 DeepSeek 自研的推理或训练加速框架相关;
  • 视频作者声称其速度「远快于 MTP」;
  • 没有公开的论文、仓库、性能数字或对比基准。

由于缺乏技术细节,DSpark 是改进了投机解码(speculative decoding)、自回归调度,还是在 MTP 基础上做了并行化优化,目前均无法判断。

后续关注点

若 DSpark 后续被 DeepSeek 官方确认,可重点跟踪以下信息:

  • 是否伴随论文或开源代码发布;
  • 在标准推理 benchmark(如 MMLU、HumanEval、长上下文任务)上的吞吐与延迟数据;
  • 与 MTP、Medusa、EAGLE 等同类方案的具体对比。

在官方信息出炉之前,建议读者将现有消息视为「线索」而非「结论」,避免基于单一视频做出技术选型判断。

信源