英伟达等提出红皇后哥德尔机：让AI与评估器协同进化

英伟达、剑桥大学等机构的研究者近日发表了一篇关于 AI 递归自我改进（RSI）的研究，提出了一种名为「红皇后哥德尔机」（Red Queen Gödel Machine，简称 RQGM）的新方法。论文已在 arXiv 上公开。该研究试图打破「评估器必须固定不变」这一长期限制，让任务智能体与评估器协同进化。

研究背景：从哥德尔机到红皇后机

2003 年，Jürgen Schmidhuber 提出了「哥德尔机」的构想——一种能从数学上证明自身修改有益后再改写自身代码的机器。但严格的数学证明对算力要求极高，二十多年来这一设想一直停留在理论层面。

近两年，研究者转向「达尔文哥德尔机」（DGM）、「赫胥黎哥德尔机」（HGM）等进化方法：让 AI 产生大量带突变的代码变体，扔进沙盒跑分，失败的淘汰，成功的保留，幸存者继续繁衍。但这些方法的共同缺陷是评估器（即「考官」）被钉死在循环之外，始终不变，违背了进化最核心的一条规律——物种必须在变化的环境中一起改变。

RQGM 正是要解决这一缺陷。其名称取自 Van Valen 1973 年提出的「红皇后假说」：「你必须拼命奔跑，才能停在原地，因为你的对手也在进化。」

核心机制：受控效用进化

RQGM 的关键设计称为「受控效用进化」（controlled utility evolution），整个搜索被切成多个 epoch：

在每个 epoch 内，评估器冻结，给所有考生打分，保证评分信号稳定；
仅在 epoch 边界才允许更换评估器；
新评估器必须在留出的「基准真相」锚点数据上统计意义上打赢旧评估器，才能「上位」；
更换评估器后执行「选择性擦除」，只丢掉由被替换的评估器给出的分数，其余证据全部保留。

也就是说，RQGM 既要求系统持续狂奔进化，又要求每一步都站得住脚。

实证结果

RQGM 在三项任务上进行了验证：

代码生成（Polyglot）：在留出测试集上，通过率从此前的 SOTA 69.9% 提升到 71.7%，同时消耗的 token 减少 1.35 至 1.72 倍，因为评审员只需查一次，比反复多轮跑测试便宜得多；
论文写作：在固定评审小组里的接受率从此前的 21.8% 提升到 40.5%；
奥赛级数学证明：进化出的评分官比静态基线更准确，搜索成本降低约 3 倍。

值得一提的是，RQGM 还缓解了 LLM 当裁判时「偏爱 AI 生成内容」的老毛病：最强的基线审稿人接受 AI 论文的概率最高是接受人类论文的 1.91 倍。RQGM 在 epoch 边界将早期放过的 AI 论文组成对抗样本池，专门训练能把这些 AI 论文揪出来打回去的新评审。最终评审对 AI 与人类论文的接受率趋于一致，并保持约 80% 的真值准确率。

研究意义

该研究将「评估器必须随选手一同进化」这一生物学直觉形式化为可操作的算法，并在多项任务上验证了其有效性，为 AI 自我改进研究提供了新的方向。需要指出的是，该论文讨论的是一种自我改进机制的设计与验证，文中所引「2028 年底 ASI 降临」等说法属于业内预测，并非已验证结论。