谷歌 2026 年 6 月 AI 更新汇总
谷歌发布 Gemma 4 12B 开源模型、Gemini 3.5 Flash 接入 computer use、Nano…
谷歌在 2026 年 6 月集中发布了覆盖模型、系统、设备和生产力工具的多项 AI 更新,重点是把大模型能力下沉到本地设备,并把多模态、自动化和翻译能力拓展到更多场景。整体思路是构建「跨设备、跨产品的统一 AI 体验」,让 Gemini 系能力出现在手机、电脑、智能音箱和应用层产品中。
开发者与模型:Gemma 4 12B 与 Gemini 3.5 系列
在开源侧,谷歌推出 Gemma 4 12B 开源模型,主打本地推理体验:仅需 16GB 内存即可在笔记本上运行,采用统一架构,原生集成视觉与语音处理,面向智能体(agent)和隐私敏感工作流。
Gemini 3.5 系列同步更新:
- Gemini 3.5 Flash 集成 computer use 能力,开发者可构建能在桌面、移动端和浏览器中「看—推理—操作」的自动化智能体,针对长链路任务与企业自动化(如持续软件测试、知识工作)做了性能优化。
- Gemini 3.5 Live Translate 是新的语音到语音实时翻译模型,原生支持 70 多种语言自动检测,并保留说话人自然语调、消除翻译停顿,适用于多语言通话、会议和出行场景;通过 Gemini Live API、Google AI Studio 以及 Google Translate 应用提供。
多模态与生成:Nano Banana 2 Lite 与 Gemini Omni Flash
谷歌发布两款面向多模态创作与开发的新模型:
- Nano Banana 2 Lite 被定位为「迄今最快、成本最低」的 Gemini Image 模型,进一步降低图像生成使用门槛。
- Gemini Omni Flash 以公开预览形式接入 API,是一款原生多模态模型,面向企业与开发者构建自定义动态视频工作流。
系统与设备:Android 17 与 6 月 Pixel Drop
Android 17 引入多项交互与安全升级,包括浮窗多任务、画中画录制的 Screen Reactions、为折叠屏优化的游戏布局,以及通过生物识别远程锁定丢失手机等能力。新系统率先登陆 Pixel 设备,后续向其他符合条件的 Android 设备逐步推送。
6 月 Pixel Drop 在此基础上增加屏幕录制反应、AI 视频与音乐生成、浮窗气泡、扩展的实时语音翻译、自定义语音信箱问候语和自动化紧急通知等功能。
智能家居:内置 Gemini 的 Google Home Speaker
谷歌推出专为 Gemini 设计的全新 Google Home 智能音箱,强调更自然的多轮对话能力:用户不必使用固定指令,音箱可理解类似真人的表达,同时处理多个请求、回答复杂问题并保留上下文记忆。配套的「Gemini for Home」语音助手带来 100 余项新场景。
生产力工具:NotebookLM、Google Finance 与 Gemini 学习
- NotebookLM 升级,加入高级推理、安全的云端代码运行环境,以及图表、电子表格和幻灯片生成能力,可把零散想法与网页资料整合为结构化研究资料库,面向 Google AI Ultra 订阅者和特定 Workspace 账号全球开放。
- 新版 Google Finance 结束 Beta,新增投资组合监控、市场情报跟踪、AI 研究工具以及解释股价异动的 AI「关键时刻」功能,并推出 Android 应用。
- Gemini App 上线 study notebooks(学习笔记本),进一步把模型能力嵌入学习场景。
整体来看,谷歌 6 月更新延续了「Gemini 为核心、Gemma 补足开源、设备与应用侧同步落地」的节奏,把推理、智能体和多模态能力向端侧和企业工作流双向推进。
