开源8 小时快讯 · 2026.06.26 16:01
NVIDIA 开源发布 MiniMax M3 NVFP4 量化版本
NVIDIA 在 Hugging Face 开源发布 MiniMax M3 的 NVFP4 量化权重,丰富开放权重模型生…
2026.06.26 · 周五约 1 分钟阅读评分 68
MiniMax M3 NVFP4 版本上线 Hugging Face
NVIDIA AI 在 Hugging Face 上发布了 MiniMax M3 的 NVFP4 量化权重,进一步扩展了 MiniMax 系列模型的开源生态。NVFP4 是 NVIDIA 推出的新一代低精度浮点格式,相比 FP16/BF16 可显著降低显存占用并提升推理吞吐,适合在 Blackwell 架构 GPU 上高效部署。
关键信息
- 模型:MiniMax M3(NVFP4 版本)
- 发布方:NVIDIA AI
- 托管平台:Hugging Face(
nvidia/MiniMax-M3-NVFP4) - 面向:开源权重生态,开发者可直接下载使用
该版本的上线意味着开发者可以在保持较高模型精度的同时,以更低显存运行 MiniMax M3,降低推理成本。对于希望在实际生产环境中部署该模型的团队而言,NVFP4 权重是一个更具性价比的选择。
