桃子桃子 AI 快讯
返回首页
模型发布

谷歌 Nano Banana 2 Lite 上线:4 秒出图,每张 0.034 美元,正面叫板字节 Seedream

谷歌推出轻量文生图模型 Nano Banana 2 Lite,1K 图定价 0.034 美元、平均 4 秒出图,在审美…

2026.07.01 · 周三5 分钟阅读

谷歌近日正式上线 Nano Banana 2 Lite 文生图模型,官方调用名称为 gemini-3.1-flash-lite-image,已登陆 Google AI Studio、Gemini API 以及 Gemini 企业代理平台。该模型以 0.034 美元/张的 1K 分辨率定价与约 4 秒的端到端生成时延,直接对标字节跳动最新轻量文生图模型 Seedream 5.0 Lite,被业界视为谷歌主动踏入此前由中国厂商主导的「性价比战场」。

价格贴身肉搏,差距仅 0.001 美元

在 API 定价层面,Nano Banana 2 Lite 单张 1K 图的生成成本被压至 0.034 美元,而 Seedream 5.0 Lite 同期定价约为 0.035 美元(国内官方渠道折算约 0.22 元/张)。单张仅 0.001 美元的差额看似微小,但在内容、电商、游戏、教育、广告等高频调用场景下,调用量的成倍放大足以让成本与延迟成为关键变量。

值得注意的是,Nano Banana 2 Lite 并非取代同系列 Pro 版本,而是将「高频海量出图」这一档补齐:在牺牲多分辨率支持(仅 1K)与部分重型能力的同时,将算力集中在速度与单位成本上,瞄准当前文生图场景下「又慢又贵」的真实痛点。

4 秒 vs 45 秒:延迟才是分水岭

据 AI 模型评测平台 Artificial Analysis 提供的第三方数据,Nano Banana 2 Lite 的端到端生成时延约为 4.0 秒,而 Seedream 5.0 Lite 高达 45.1 秒。二者在价格上的微小差距,远不及延迟上十倍级的差异来得关键。

对设计工具、电商后台、广告平台、社交应用与游戏 UGC 而言,4 秒级响应意味着「改一句提示词、换一个风格、几秒看到结果」的即时反馈,使图像生成有机会嵌入实际产品交互流,而非仅仅作为离线的图片工具。

审美 Elo 反超 Pro:轻量也能不妥协

在基于人类盲测的文生图审美偏好评分上,Nano Banana 2 Lite 取得 Elo 1251,高于 Seedream 5.0 Lite 的 1132,并在部分基准上甚至超过同系列参数量更大的 Pro 版本,打破了「参数量决定一切」的传统认知。

这一表现得益于两项核心策略:

  • 知识蒸馏:Lite 版在训练中利用 Gemini 3.1 系列更大规模模型生成的合成数据进行对齐,继承了旗舰模型对物理世界与复杂物体关系的理解能力。
  • 场景化特训:针对风景、人像、常见物体等最高频提示词场景进行精细化清洗与权重提升,在通用场景上比追求通用的大模型更稳定。

在细节控制上,Lite 版通过引入文本感知分支强化了 OCR 级文字生成能力,并采用特征锚定机制提升多轮生成中同一主体的面部与服装一致性,缓解了轻量模型「便宜但不敢用」的顽疾。

技术上,Lite 版默认运行于 Low-Thinking 模式,跳过大部分复杂逻辑推理步骤,直接利用训练好的潜空间映射快速采样;同时针对 1K 分辨率请求做了算子融合与批处理优化,提升 GPU 利用率以摊薄单图推理成本。

接棒视频生成:Omni Flash 解锁完整链路

在 Nano Banana 2 Lite 发布的同时,谷歌解禁了多模态模型 Gemini Omni Flash,二者在生态中构成接力关系:Lite 负责极速出图,Omni Flash 负责视频生成与对话式编辑。

Omni Flash 在「Overall Preference」与「Instruction Following」两个 Elo 维度上均位列前茅,领先于阿里 HappyHorse、快手 Kling v3 Pro 以及字节 Seedance 2.0。其 Interactions API 可在三轮自然语言指令内保留会话历史并叠加修改,避免视频编辑中的「记忆丢失」。输出定价为 0.10 美元/秒(与 Veo 3.1 Fast 持平),支持最长 10 秒视频生成。

谷歌已针对电商、室内设计、社媒传播三个场景上架了对应功能模块,例如先由 Lite 生成多角度商品静态图,再一键转为电商短视频,缩短素材制作周期。当前的局限包括暂不支持音频参考上传、场景延展受限以及复杂运镜下的人物一致性仍有优化空间。

从参数竞赛转向生产竞赛

旗舰模型时代,行业比的是人脸真假、构图复杂度与光影高级感;而在 Lite 级别,问题变成了另一套:一张图多少钱、多久返回、能否批量运行、能否稳定修改、能否接进视频。

Seedream 代表的路线,是把搜索、推理、理解与生成揉进同一套图像系统;Nano Banana 2 Lite 展现的则是另一种思路——用 Gemini 家族的基础能力,把轻量图像模型做成高吞吐、低延迟、可接视频的生产接口。两条路线背后,是字节依托内容产业链的爆款逻辑与谷歌依托开发者工具、云平台与企业工作流的基础设施逻辑之间的差异。

信源