研究论文
ASPIRE:让机器人技能库自我演化与无限累积
NVIDIA 研究员 Jim Fan 提出 ASPIRE 框架,用编码智能体对机器人的感知轨迹做进化搜索,将最优控制策略…
2026.07.01 · 周三约 2 分钟阅读
NVIDIA 知名研究员 Jim Fan 在 X 平台公布了一项名为 ASPIRE 的机器人学习新框架,其核心思路是用持续扩充的「技能库」取代传统以梯度下降训练得到的权重,让机器人在不断完成任务的过程中实现技能的自演化与复用。
核心思路:用技能库替代权重
ASPIRE 的基本工作流可以概括为:编码智能体观察来自仿真与真实机器人的多模态感知轨迹,对候选控制程序发起进化搜索,再将表现最好的「操作诀窍」提炼并写入一个不断增长的技能仓库。Jim Fan 把它称为一种「新形态的持续学习」:
- 「训练」不再是梯度下降,而是对已有技能的反复打磨;
- 「训练好的模型」不是一组浮点权重,而是一个仓库式的感知运动技能集合;
- 「分布式训练」也不是把 mini-batch 切到多张卡上,而是让一组智能体各自专攻不同的技能并同步沉淀。
重新定义 Sim2Real 与跨本体迁移
传统机器人策略在从仿真迁移到真实环境时,往往需要同时消化视觉差距与接触物理建模误差,难度极大;而从单臂切换到双臂系统时,通常又得重新采集数据、重新训练。ASPIRE 选择绕开这些难题:它跨过 Sim2Real 鸿沟的并不是像素或权重,而是已经验证过的「操作诀窍」。真实机器人仍需在物理世界中练习,但不必再从零摸索策略,因此能够显著加快收敛。
已公布的量化结果
根据 Jim Fan 的描述,ASPIRE 在跨平台迁移场景下实现了以下进展:
- 跨仿真到真实、跨单臂到双臂的迁移,可将「迁移学习 token」消耗降低约十倍;
- 项目网站展示了 150 余项任务与 90 多项机器人自学的技能;
- 「学到的权重」可以以一个 HTML 页面而非 GGUF 文件的形式交付,直观体现其「知识外化」的思路。
后续计划
Jim Fan 表示团队将把整套栈开源,使外部机器人能够直接复用并在其基础上继续累积技能。论文级别的细节尚未在原帖中给出,更多技术内容仍待后续披露。
