桃子桃子 AI 快讯
返回首页
研究论文

英伟达等提出红皇后哥德尔机:让AI与评估器协同进化

英伟达、剑桥等机构提出红皇后哥德尔机,让AI任务智能体与评估器一起进化,在代码、论文、数学三项任务上验证了效果。

2026.06.28 · 周日3 分钟阅读评分 60
评分细项加权总分 60
重要性
60
新颖性
65
影响面
50
可信度
60
实质性
70

英伟达、剑桥大学等机构的研究者近日发表了一篇关于 AI 递归自我改进(RSI)的研究,提出了一种名为「红皇后哥德尔机」(Red Queen Gödel Machine,简称 RQGM)的新方法。论文已在 arXiv 上公开。该研究试图打破「评估器必须固定不变」这一长期限制,让任务智能体与评估器协同进化。

研究背景:从哥德尔机到红皇后机

2003 年,Jürgen Schmidhuber 提出了「哥德尔机」的构想——一种能从数学上证明自身修改有益后再改写自身代码的机器。但严格的数学证明对算力要求极高,二十多年来这一设想一直停留在理论层面。

近两年,研究者转向「达尔文哥德尔机」(DGM)、「赫胥黎哥德尔机」(HGM)等进化方法:让 AI 产生大量带突变的代码变体,扔进沙盒跑分,失败的淘汰,成功的保留,幸存者继续繁衍。但这些方法的共同缺陷是评估器(即「考官」)被钉死在循环之外,始终不变,违背了进化最核心的一条规律——物种必须在变化的环境中一起改变。

RQGM 正是要解决这一缺陷。其名称取自 Van Valen 1973 年提出的「红皇后假说」:「你必须拼命奔跑,才能停在原地,因为你的对手也在进化。」

核心机制:受控效用进化

RQGM 的关键设计称为「受控效用进化」(controlled utility evolution),整个搜索被切成多个 epoch:

  • 在每个 epoch 内,评估器冻结,给所有考生打分,保证评分信号稳定;
  • 仅在 epoch 边界才允许更换评估器;
  • 新评估器必须在留出的「基准真相」锚点数据上统计意义上打赢旧评估器,才能「上位」;
  • 更换评估器后执行「选择性擦除」,只丢掉由被替换的评估器给出的分数,其余证据全部保留。

也就是说,RQGM 既要求系统持续狂奔进化,又要求每一步都站得住脚。

实证结果

RQGM 在三项任务上进行了验证:

  • 代码生成(Polyglot):在留出测试集上,通过率从此前的 SOTA 69.9% 提升到 71.7%,同时消耗的 token 减少 1.35 至 1.72 倍,因为评审员只需查一次,比反复多轮跑测试便宜得多;
  • 论文写作:在固定评审小组里的接受率从此前的 21.8% 提升到 40.5%;
  • 奥赛级数学证明:进化出的评分官比静态基线更准确,搜索成本降低约 3 倍。

值得一提的是,RQGM 还缓解了 LLM 当裁判时「偏爱 AI 生成内容」的老毛病:最强的基线审稿人接受 AI 论文的概率最高是接受人类论文的 1.91 倍。RQGM 在 epoch 边界将早期放过的 AI 论文组成对抗样本池,专门训练能把这些 AI 论文揪出来打回去的新评审。最终评审对 AI 与人类论文的接受率趋于一致,并保持约 80% 的真值准确率。

研究意义

该研究将「评估器必须随选手一同进化」这一生物学直觉形式化为可操作的算法,并在多项任务上验证了其有效性,为 AI 自我改进研究提供了新的方向。需要指出的是,该论文讨论的是一种自我改进机制的设计与验证,文中所引「2028 年底 ASI 降临」等说法属于业内预测,并非已验证结论。

信源