Jack Clark、哈萨比斯、Altman 先后发声,递归自我改进正从理论变成日程;Claude 已编写 Anthro…
当一家公司八成以上的代码已由自家模型编写、当一个 AI 可以连续 19 天无人干预地独立完成一项软件工程、而三家全球顶尖 AI 实验室的负责人几乎同时把「递归自我改进」挂到嘴边——RSI(Recursive Self-Improvement,递归自我改进)已经从论文里的概念,变成了日程表上的一个具体年份。2026 年 5 月,Anthropic 联合创始人 Jack Clark、谷歌 DeepMind 掌门人 Demis Hassabis、OpenAI CEO Sam Altman 围绕同一议题罕见地形成共振,把这场关于「AI 自己造 AI」的倒计时推到了公众视野中央。
Jack Clark 在 Aspen Institute 活动及个人博客 Import AI 中给出了迄今最具体的 RSI 时间线:到 2028 年底,AI 系统很可能自主设计实验、编写训练代码、运行评估,并构建出比自己更强的下一代模型,全程无需人类研究员参与。他给出的概率信号是 60%。
支撑这一判断的,是一条清晰的曲线:
METR 自己承认,16 小时以上的测量值在现有任务套件中已不可靠。换言之,不是 AI 不行了,是人类出的考题不够难了。
如果说 Jack Clark 给的是时间表,Anthropic 5 月发布的《When AI builds itself》内部数据则给出了「飞轮已经在转」的硬证据:
更冷峻的证据来自 Epoch AI 与 METR 联合发布的 MirrorCode 基准:测试者锁住源代码,只给 AI 一个可执行黑盒与文档,要求它从零重建整个软件。Claude Opus 4.7 重新实现了拥有 16000 行 Go 代码、40 多个命令的生物信息学工具 gotree,通过 99.95% 的测试用例,耗时 14 小时、花费 251 美元;人类工程师完成同等工作需要 2 到 17 周。最大规模任务中,AI 连续不间断编程 19 天,耗资 2600 美元,全程零人类干预。一年前顶级模型在该基准上只能拿约 30% 的分数,Claude Opus 4.7 已达 56%。
DeepMind 掌门人哈萨比斯在 Axios 专访中明确表示:「所有领先实验室,都在高度聚焦这件事。」他将当前阶段描述为「软自我改进」——编码智能体正让工程师产出能力大幅提升。DeepMind 自家由 Gemini 驱动的 AlphaEvolve 进化编码智能体,已用 AI 优化构建 AI 本身的代码与算法,解开了困扰数学家数十年的难题。在达沃斯论坛上被问到「会不会像奥本海默一样后悔」时,他回答:「我无时无刻不在担心这类情景,这就是我睡不好觉的原因。」
OpenAI 的表态同样直白。其政策蓝图《Democratic Governance of Frontier AI》写道:「我们在当今系统中看到了递归自我改进的早期迹象:AI 的发展本身正在被 AI 加速。」OpenAI 将 RSI 称为「未来十年最具影响力的前沿安全议题」。更引人注目的是 Sam Altman 在内部 Slack 中向员工释放的信号:OpenAI 可能不到六个月就会实现 RSI;如果 RSI 真的到来,他宁愿推迟那场估值 8520 亿美元的 IPO——因为「RSI 起飞得越快,推迟 IPO 的好处就越大」。
三大信号同时亮起:Anthropic 给出了内部数据与时间线,DeepMind 确认了全行业范围,OpenAI 用一场可能推迟的万亿 IPO 投下了信任票。80% 的代码、8 倍的产能、52 倍的加速、19 天不眠不休的独立编程、60% 的概率、不到六个月的倒计时——每一个数字,都是飞轮转动的一声咔哒。
正如哈萨比斯所说:「我更希望进度慢一些,那对世界更好。」但他也承认,这场竞争「烈度前所未有」,没有人愿意先停下来。剩下的核心问题已不再是「会不会发生」,而是:当倒计时走到 2028,我们,准备好了吗?