桃子桃子 AI 快讯
返回首页
产品功能

DeepMind 发布 Nano Banana 2 Lite 与 Gemini Omni Flash

Google DeepMind 上线 Nano Banana 2 Lite 图像模型与 Gemini Omni Flas…

2026.07.01 · 周三3 分钟阅读

Google DeepMind 于 6 月 30 日发布两款面向生成式多媒体场景的新模型——图像方向的 Nano Banana 2 Lite 与视频方向的 Gemini Omni Flash。两款模型均已在 Google AI Studio、Gemini API 与 Gemini Enterprise Agent Platform 上线,并同步面向消费端产品逐步铺开。

Nano Banana 2 Lite:面向高吞吐量的轻量图像模型

Nano Banana 2 Lite 是 Nano Banana 系列中目前速度最快、成本最低的图像生成模型,定位强调高吞吐量与可扩展性,适合需要批量出图或快速迭代的开发者与产品场景。DeepMind 在博文中将其作为系列中「最高效」的版本推出,主打以更低成本支撑规模化部署。

可用入口包括:

  • 开发者侧:Google AI Studio、Gemini API、Gemini Enterprise Agent Platform(今日起可用)
  • 消费侧:Search 中的 AI Mode、Gemini 应用及其他 Google 产品(今日起逐步推送)

Gemini Omni Flash:首次面向开发者的视频生成模型

Gemini Omni Flash 是 Google 在视频生成与对话式编辑方向的主力模型,此次是其首次向开发者开放。该模型主打高质量与成本可控的视频生成能力,支持对话式编辑,可用于端到端的多媒体内容创作与改稿流程。

可用入口包括:

  • 开发者侧:Google AI Studio、Gemini API、Gemini Enterprise Agent Platform(首次开放)
  • 消费侧:Gemini 应用与 Google Flow

串联图像与视频的多媒体工作流

DeepMind 在博文中强调,生成式媒体的创作过程通常依赖多轮迭代:Nano Banana 2 Lite 负责快速、低成本的图像生成,Gemini Omni Flash 负责视频生成与对话式编辑。两款模型共用同一套开发者接口,使开发者可以在同一栈内搭建覆盖图像到视频的端到端多媒体工作流,从原型实验一路延伸到规模化部署。

两款模型的发布也意味着 Google 进一步把图像与视频生成能力同时下放到 API 层面,降低了开发者在多模态应用上的接入门槛。

信源