桃子 AI 快讯

←返回首页

模型发布8 小时快讯 · 2026.06.25 16:34

NVIDIA 发布扩散语言模型 Nemotron-TwoTower

NVIDIA 推出扩散式语言模型，并行生成令牌，吞吐量提升 2.42 倍。

2026.06.25 · 周四约 1 分钟阅读评分 85

NVIDIA 发布了 Nemotron-TwoTower-30B-A3B-Base-BF16，这是一种基于扩散的新型语言模型，由 Nemotron 3 Nano 30B-A3B 骨干网络构建。

技术特点：

采用冻结自回归上下文塔和扩散去噪塔，并行填充令牌块，而非逐令牌生成。
默认掩码扩散设置下，保留了自回归基线 98.7% 的聚合基准质量，同时实现了 2.42 倍的实际生成吞吐量提升。

该模型发布标志着扩散式语言模型在保持质量的同时大幅加速推理，为高效文本生成提供了新路径。

关键词#NVIDIA #扩散模型 #语言模型 #推理加速

信源

↗Reddit · r/LocalLLaMA

← 全部资讯回到首页 →