桃子桃子快讯
返回首页
开源

商汤 SenseNova 开源 8B 信息图专用图像模型

商汤 SenseNova-U1-8B-MoT 系列更新 Infographic V2 版本,Apache 2 开源,专注…

2026.07.02 · 周四3 分钟阅读

商汤 SenseNova 近日更新了 SenseNova-U1-8B-MoT-Infographic 系列模型,其中 V2 版本于日前在 Hugging Face 上发布。该模型基于 Mixture of Transformers(MoT)架构,定位为开源的信息图(infographic)生成与编辑专用模型,许可证为 Apache 2.0,可自由商用。

核心能力:密集信息图生成

Infographic V2 是一个 50 步采样的基础模型,官方介绍称它「专门针对密集信息图场景做了训练」。除了信息图之外,它也可以生成常规图像。社区用户在实际测试后表示,在信息图场景下,V2 的输出密度和排版质量是近期他体验过的开源模型中表现最强的一档,并且明确优于其同样不满意的 ComfyUI 工作流体验。

用户还将它与 Ideogram 4 做了横向对比,认为在信息图这一垂直任务上,SenseNova V2 已经与 Ideogram 4 接近甚至部分超越,加上 Apache 2.0 许可证的友好程度(Ideogram 许可证限制较多),开源阵营一方更具吸引力。

模型版本与配套 LoRA

SenseNova-U1 系列目前在 Hugging Face 上提供了多个相互配套的权重资源:

  • SenseNova-U1-8B-MoT-Infographic-V2:50 步基础模型,主推版本。
  • SenseNova-U1-8B-MoT-Infographic-LoRA-8step-V1.0:8 步蒸馏 LoRA,速度更快但画质有所下降。
  • SenseNova-U1-8B-MoT-Infographic V1 基础模型:50 步版本,在 V2 发布后一般不再单独使用,仅在与 8 步 LoRA 配合时有用。
  • SenseNova-U1-8B-MoT-Interleaved:交错图像版本,可以生成一系列风格、字体、色彩保持一致的相关图像,适合用来制作统一主题的幻灯片、绘本等。

Infographic 系列本身聚焦单图信息图;Interleaved 版本则补齐了多图一致性这一块能力。

部署方式与硬件门槛

模型尚未提供官方 GGUF 量化版本,社区做法是自行用 FastAPI 将模型包装为 OpenAI 兼容的图像生成与编辑端点,并装进单个 Docker 容器;Interleaved 版本因为一次会输出多张图,无法直接挂在标准 OpenAI 图像接口上,需要搭建带 emitter event 的工具管线来传输。

硬件需求方面:

  • 全精度 bf16:约需 36GB 显存。
  • 最小量化版本:约需 16GB 显存。
  • 也有社区 GGUF 量化可供选择。

社区反响

该帖作者对近期新模型普遍「审美疲劳」,但称 SenseNova 的 MoT 系列让他「眼前一亮」。需要注意的是,这属于 LocalLLaMA 社区用户的个人体验分享,并非官方介绍或基准测试报告,能力评价带有明显主观色彩,对 Ideogram 4 的对比也没有公开可复现的评估数据作为支撑。

模型权重均已托管在 Hugging Face 的 sensenova 组织下,感兴趣的开发者可以直接拉取权重进行本地部署或二次开发。

信源