Google 开源 XR Blocks：集成 Gemini 的轻量 XR 原型开发库

Google XR Labs 在 GitHub 发布了一款名为 XR Blocks 的开源 JavaScript 库，面向 XR（扩展现实）与 AI 体验的快速原型开发。该库基于 three.js 构建，可在 Chrome v136+ 浏览器中运行，并支持 Android XR 设备（如三星 Galaxy XR），同时提供桌面模拟器方便开发调试。需要注意的是，官方明确声明「这不是 Google 官方支持的产品」，但由 XR Labs 团队及外部贡献者持续维护。

核心功能

XR Blocks 的设计目标是降低沉浸式应用的开发门槛，主要能力包括：

手势与手部追踪：支持捏合、张掌、握拳、竖拇指、指向、张开六种预设手势，可结合 TensorFlow Lite 或 PyTorch 自定义手势模型；
世界理解：集成深度传感、几何感知物理与物体识别，在 XR 设备和桌面模拟器中均可运行；
AI 集成：原生对接 Gemini，支持多模态理解与 Gemini Live 实时对话；
跨平台：一次编写，可在 XR 设备与桌面 Chrome 浏览器之间复用；
自动化模式：通过 options.enableAutomationMode() 或 ?xrAutomation=1 启用，便于远程脚本驱动模拟器。

AI 与隐私机制

XR Blocks 在 AI 数据处理上做了明确分层。涉及 WebXR 与 LiteRT（深度感知、手势识别）的功能，数据全部在本地通过端侧模型处理，不上传服务器；而调用 Gemini Live、Gemini Flash 等云端 AI 能力时，相关数据将发送至 Gemini 服务，开发者需遵循 Google 的隐私与服务条款。这意味着接入 Gemini 是该库最显著的 AI 切入点，但其他 XR 感知能力则强调本地化以保护用户隐私。

开发与上手

开发者只需通过 importmap 引入 xrblocks 与 three.js 模块即可使用，官方示例展示了不到 50 行代码即可实现一个可交互的圆柱体场景。本地开发流程为：

git clone 仓库后执行 npm ci 安装依赖；
npm run serve 在 http://localhost:8080 运行示例与 Demo；
npm run dev 同时启动 SDK watch 模式与本地服务；
npm run lint / npm run format 使用 ESLint 与 Prettier 检查代码风格。

项目已发布至 GitHub（google/xrblocks），并配套白皮书与博客文章阐述 AI + XR 社区愿景。整体来看，XR Blocks 更偏向实验性原型工具，适合希望快速验证 XR 交互或 Gemini 多模态应用的开发者，但对生产级应用而言，其「非官方 Google 产品」的定位意味着稳定性与长期支持仍存在不确定性。