桃子桃子 AI 快讯
返回首页
模型发布

谷歌双模齐发:Omni Flash 开放 API,Nano Banana 2 Lite 4 秒出图

Google 开放 Gemini Omni Flash 视频生成 API,并推出 Nano Banana 2 Lite…

2026.07.01 · 周三4 分钟阅读

Google 近日正式通过 Gemini API 和 Google AI Studio 向开发者开放 Gemini Omni Flash,并同步推出高速生图模型 Nano Banana 2 Lite(内部代号 gemini-3.1-flash-lite-image)。两款模型均强调多模态能力与生态协同,尤其在图像与视频的串联创作场景中形成「1+1>2」的组合工作流。

Gemini Omni Flash:视频生成 API 正式开放

Gemini Omni Flash 最初在 Google I/O 2026 大会上首次亮相,将 Gemini 的多模态推理能力与视频生成、编辑能力深度结合。此次开放后,开发者可基于文本、图像和视频等多种输入生成并编辑视频。官方强调四项关键能力:

  • 对话式视频编辑:用自然语言修改视频内容,交互方式类似在线文档。
  • 多模态参考:组合图像、文本、视频输入,保持场景控制与一致性。
  • 现实世界知识:调用 Gemini 在历史、生物、叙事逻辑等方面的世界知识辅助视频构建。
  • 文字与动作同步:通过提示词将文字、图形直接关联到视频动作上。

定价方面,Omni Flash 的视频输出成本为每秒 0.10 美元,与 Veo 3.1 Fast 持平。Google 也坦诚列出了现阶段局限:目前仅支持 10 秒视频生成,不支持音频参考上传与场景扩展,API 虽支持最长 3 秒参考视频但模型处理尚不稳定,场景切换与运镜中的人物一致性仍有不足。

Nano Banana 2 Lite:4 秒出图,单张约 0.034 美元

Nano Banana 2 Lite 专为低延迟、批量处理场景设计,瞄准电商素材、广告创意、自动化内容流水线等对响应速度敏感的应用。其核心卖点在于速度与成本:

  • 出图延迟约 4 秒,约为 Nano Banana 2 的五分之一(后者约 20 秒)。
  • 1K 分辨率图像单张成本约 0.034 美元,约为 Nano Banana 2 的一半、Nano Banana Pro 的四分之一。

速度与价格大幅压缩的同时,Lite 版在文字渲染等关键能力上仍保持了与 Grok 等模型相近的 benchmark 水平。Google 建议仍在使用初代 Nano Banana 的用户尽快迁移,称 Lite 版已在关键指标上实现全方位超越。

图像 + 视频:双模型串联的组合工作流

本次发布更值得关注的,是两款模型的联动使用方式。借助图像生成与视频创作的无缝衔接,开发者可以先用 Nano Banana 2 Lite 快速出图,再将结果作为参考素材输入 Omni Flash,一键转化为视频。Google 同步展示了三个 Demo 应用:

  • Anywhere:上传自拍后由 NB2 Lite 将人物「P」进全球地标景点,再由 Omni Flash 转为动态短片。
  • Space Lift:上传房间照片后生成多种装修风格方案,选定后由 Omni Flash 输出电影级空间漫游视频。
  • Omni Product Studio:白底产品图经 NB2 Lite 生成场景化商品图,再由 Omni Flash 转化为电商短视频。

从「产品」到「广告素材」的全链路自动化,是这套组合在电商、装修、短视频等垂直场景的明确落地方向。配合 Android 生态,Google 在多模态生成的产品化路径上正逐步拉开与竞争对手的距离。

信源