ASPIRE：让机器人技能库自我演化与无限累积

NVIDIA 知名研究员 Jim Fan 在 X 平台公布了一项名为 ASPIRE 的机器人学习新框架，其核心思路是用持续扩充的「技能库」取代传统以梯度下降训练得到的权重，让机器人在不断完成任务的过程中实现技能的自演化与复用。

核心思路：用技能库替代权重

ASPIRE 的基本工作流可以概括为：编码智能体观察来自仿真与真实机器人的多模态感知轨迹，对候选控制程序发起进化搜索，再将表现最好的「操作诀窍」提炼并写入一个不断增长的技能仓库。Jim Fan 把它称为一种「新形态的持续学习」：

「训练」不再是梯度下降，而是对已有技能的反复打磨；
「训练好的模型」不是一组浮点权重，而是一个仓库式的感知运动技能集合；
「分布式训练」也不是把 mini-batch 切到多张卡上，而是让一组智能体各自专攻不同的技能并同步沉淀。

重新定义 Sim2Real 与跨本体迁移

传统机器人策略在从仿真迁移到真实环境时，往往需要同时消化视觉差距与接触物理建模误差，难度极大；而从单臂切换到双臂系统时，通常又得重新采集数据、重新训练。ASPIRE 选择绕开这些难题：它跨过 Sim2Real 鸿沟的并不是像素或权重，而是已经验证过的「操作诀窍」。真实机器人仍需在物理世界中练习，但不必再从零摸索策略，因此能够显著加快收敛。

已公布的量化结果

根据 Jim Fan 的描述，ASPIRE 在跨平台迁移场景下实现了以下进展：

跨仿真到真实、跨单臂到双臂的迁移，可将「迁移学习 token」消耗降低约十倍；
项目网站展示了 150 余项任务与 90 多项机器人自学的技能；
「学到的权重」可以以一个 HTML 页面而非 GGUF 文件的形式交付，直观体现其「知识外化」的思路。

后续计划

Jim Fan 表示团队将把整套栈开源，使外部机器人能够直接复用并在其基础上继续累积技能。论文级别的细节尚未在原帖中给出，更多技术内容仍待后续披露。