模型发布8 小时快讯 · 2026.06.25 16:34
NVIDIA 发布扩散语言模型 Nemotron-TwoTower
NVIDIA 推出扩散式语言模型,并行生成令牌,吞吐量提升 2.42 倍。
2026.06.25 · 周四约 1 分钟阅读评分 85
NVIDIA 发布了 Nemotron-TwoTower-30B-A3B-Base-BF16,这是一种基于扩散的新型语言模型,由 Nemotron 3 Nano 30B-A3B 骨干网络构建。
技术特点:
- 采用冻结自回归上下文塔和扩散去噪塔,并行填充令牌块,而非逐令牌生成。
- 默认掩码扩散设置下,保留了自回归基线 98.7% 的聚合基准质量,同时实现了 2.42 倍的实际生成吞吐量提升。
该模型发布标志着扩散式语言模型在保持质量的同时大幅加速推理,为高效文本生成提供了新路径。
