Google 开源 XR Blocks:集成 Gemini 的轻量 XR 原型开发库
Google XR Labs 发布开源 JS 库 XR Blocks,用于快速搭建 XR 与 AI 原型,内置手势识别、…
Google XR Labs 在 GitHub 发布了一款名为 XR Blocks 的开源 JavaScript 库,面向 XR(扩展现实)与 AI 体验的快速原型开发。该库基于 three.js 构建,可在 Chrome v136+ 浏览器中运行,并支持 Android XR 设备(如三星 Galaxy XR),同时提供桌面模拟器方便开发调试。需要注意的是,官方明确声明「这不是 Google 官方支持的产品」,但由 XR Labs 团队及外部贡献者持续维护。
核心功能
XR Blocks 的设计目标是降低沉浸式应用的开发门槛,主要能力包括:
- 手势与手部追踪:支持捏合、张掌、握拳、竖拇指、指向、张开六种预设手势,可结合 TensorFlow Lite 或 PyTorch 自定义手势模型;
- 世界理解:集成深度传感、几何感知物理与物体识别,在 XR 设备和桌面模拟器中均可运行;
- AI 集成:原生对接 Gemini,支持多模态理解与 Gemini Live 实时对话;
- 跨平台:一次编写,可在 XR 设备与桌面 Chrome 浏览器之间复用;
- 自动化模式:通过
options.enableAutomationMode()或?xrAutomation=1启用,便于远程脚本驱动模拟器。
AI 与隐私机制
XR Blocks 在 AI 数据处理上做了明确分层。涉及 WebXR 与 LiteRT(深度感知、手势识别)的功能,数据全部在本地通过端侧模型处理,不上传服务器;而调用 Gemini Live、Gemini Flash 等云端 AI 能力时,相关数据将发送至 Gemini 服务,开发者需遵循 Google 的隐私与服务条款。这意味着接入 Gemini 是该库最显著的 AI 切入点,但其他 XR 感知能力则强调本地化以保护用户隐私。
开发与上手
开发者只需通过 importmap 引入 xrblocks 与 three.js 模块即可使用,官方示例展示了不到 50 行代码即可实现一个可交互的圆柱体场景。本地开发流程为:
git clone仓库后执行npm ci安装依赖;npm run serve在http://localhost:8080运行示例与 Demo;npm run dev同时启动 SDK watch 模式与本地服务;npm run lint/npm run format使用 ESLint 与 Prettier 检查代码风格。
项目已发布至 GitHub(google/xrblocks),并配套白皮书与博客文章阐述 AI + XR 社区愿景。整体来看,XR Blocks 更偏向实验性原型工具,适合希望快速验证 XR 交互或 Gemini 多模态应用的开发者,但对生产级应用而言,其「非官方 Google 产品」的定位意味着稳定性与长期支持仍存在不确定性。
