桃子桃子 AI 快讯
返回首页
开源8 小时快讯 · 2026.06.26 16:01

NVIDIA 开源发布 MiniMax M3 NVFP4 量化版本

NVIDIA 在 Hugging Face 开源发布 MiniMax M3 的 NVFP4 量化权重,丰富开放权重模型生…

2026.06.26 · 周五1 分钟阅读评分 68

MiniMax M3 NVFP4 版本上线 Hugging Face

NVIDIA AI 在 Hugging Face 上发布了 MiniMax M3 的 NVFP4 量化权重,进一步扩展了 MiniMax 系列模型的开源生态。NVFP4 是 NVIDIA 推出的新一代低精度浮点格式,相比 FP16/BF16 可显著降低显存占用并提升推理吞吐,适合在 Blackwell 架构 GPU 上高效部署。

关键信息

  • 模型:MiniMax M3(NVFP4 版本)
  • 发布方:NVIDIA AI
  • 托管平台:Hugging Face(nvidia/MiniMax-M3-NVFP4
  • 面向:开源权重生态,开发者可直接下载使用

该版本的上线意味着开发者可以在保持较高模型精度的同时,以更低显存运行 MiniMax M3,降低推理成本。对于希望在实际生产环境中部署该模型的团队而言,NVFP4 权重是一个更具性价比的选择。

信源