2028 RSI 倒计时：AI 开始自己造自己

当一家公司八成以上的代码已由自家模型编写、当一个 AI 可以连续 19 天无人干预地独立完成一项软件工程、而三家全球顶尖 AI 实验室的负责人几乎同时把「递归自我改进」挂到嘴边——RSI（Recursive Self-Improvement，递归自我改进）已经从论文里的概念，变成了日程表上的一个具体年份。2026 年 5 月，Anthropic 联合创始人 Jack Clark、谷歌 DeepMind 掌门人 Demis Hassabis、OpenAI CEO Sam Altman 围绕同一议题罕见地形成共振，把这场关于「AI 自己造 AI」的倒计时推到了公众视野中央。

Jack Clark 的时间表：2028 年底，60% 的概率

Jack Clark 在 Aspen Institute 活动及个人博客 Import AI 中给出了迄今最具体的 RSI 时间线：到 2028 年底，AI 系统很可能自主设计实验、编写训练代码、运行评估，并构建出比自己更强的下一代模型，全程无需人类研究员参与。他给出的概率信号是 60%。

支撑这一判断的，是一条清晰的曲线：

2024 年 3 月，Claude 仅能完成人类 4 分钟的工作。
一年后，能力跃升至 1.5 小时。
再一年，达到 12 小时。
2026 年 5 月，METR 评估 Claude Mythos Preview 时，50% 成功率任务时长被推至「至少 16 小时」——已是 METR 现有 228 项测试任务所能衡量的上限。

METR 自己承认，16 小时以上的测量值在现有任务套件中已不可靠。换言之，不是 AI 不行了，是人类出的考题不够难了。

数据：Claude 已在独立造自己

如果说 Jack Clark 给的是时间表，Anthropic 5 月发布的《When AI builds itself》内部数据则给出了「飞轮已经在转」的硬证据：

截至 2026 年 5 月，Anthropic 合入代码库的代码中，超过 80% 由 Claude 编写；2025 年 2 月 Claude Code 发布前，这一比例还是个位数。
2026 年二季度，一位典型工程师每天合并的代码量是 2024 年的 8 倍。
内部 130 名研究人员调查显示，产出中位数为「无 AI 时的 4 倍」。
在最开放、最模糊的编程任务上，Claude 成功率半年内从 26% 升至 76%。
优化小型 AI 训练代码的任务中，2025 年 5 月 Claude Opus 4 做到 3 倍加速；2026 年 4 月 Claude Mythos Preview 干到 52 倍——而熟练人类研究员需要 4 到 8 小时才能做到 4 倍。

更冷峻的证据来自 Epoch AI 与 METR 联合发布的 MirrorCode 基准：测试者锁住源代码，只给 AI 一个可执行黑盒与文档，要求它从零重建整个软件。Claude Opus 4.7 重新实现了拥有 16000 行 Go 代码、40 多个命令的生物信息学工具 gotree，通过 99.95% 的测试用例，耗时 14 小时、花费 251 美元；人类工程师完成同等工作需要 2 到 17 周。最大规模任务中，AI 连续不间断编程 19 天，耗资 2600 美元，全程零人类干预。一年前顶级模型在该基准上只能拿约 30% 的分数，Claude Opus 4.7 已达 56%。

哈萨比斯与 Altman：全员入场，节奏比预期更快

DeepMind 掌门人哈萨比斯在 Axios 专访中明确表示：「所有领先实验室，都在高度聚焦这件事。」他将当前阶段描述为「软自我改进」——编码智能体正让工程师产出能力大幅提升。DeepMind 自家由 Gemini 驱动的 AlphaEvolve 进化编码智能体，已用 AI 优化构建 AI 本身的代码与算法，解开了困扰数学家数十年的难题。在达沃斯论坛上被问到「会不会像奥本海默一样后悔」时，他回答：「我无时无刻不在担心这类情景，这就是我睡不好觉的原因。」

OpenAI 的表态同样直白。其政策蓝图《Democratic Governance of Frontier AI》写道：「我们在当今系统中看到了递归自我改进的早期迹象：AI 的发展本身正在被 AI 加速。」OpenAI 将 RSI 称为「未来十年最具影响力的前沿安全议题」。更引人注目的是 Sam Altman 在内部 Slack 中向员工释放的信号：OpenAI 可能不到六个月就会实现 RSI；如果 RSI 真的到来，他宁愿推迟那场估值 8520 亿美元的 IPO——因为「RSI 起飞得越快，推迟 IPO 的好处就越大」。

倒计时已启动

三大信号同时亮起：Anthropic 给出了内部数据与时间线，DeepMind 确认了全行业范围，OpenAI 用一场可能推迟的万亿 IPO 投下了信任票。80% 的代码、8 倍的产能、52 倍的加速、19 天不眠不休的独立编程、60% 的概率、不到六个月的倒计时——每一个数字，都是飞轮转动的一声咔哒。

正如哈萨比斯所说：「我更希望进度慢一些，那对世界更好。」但他也承认，这场竞争「烈度前所未有」，没有人愿意先停下来。剩下的核心问题已不再是「会不会发生」，而是：当倒计时走到 2028，我们，准备好了吗？

Jack Clark 的时间表：2028 年底，60% 的概率

支撑这一判断的，是一条清晰的曲线：

2024 年 3 月，Claude 仅能完成人类 4 分钟的工作。

一年后，能力跃升至 1.5 小时。

再一年，达到 12 小时。

2026 年 5 月，METR 评估 Claude Mythos Preview 时，50% 成功率任务时长被推至「至少 16 小时」——已是 METR 现有 228 项测试任务所能衡量的上限。

METR 自己承认，16 小时以上的测量值在现有任务套件中已不可靠。换言之，不是 AI 不行了，是人类出的考题不够难了。

数据：Claude 已在独立造自己

如果说 Jack Clark 给的是时间表，Anthropic 5 月发布的《When AI builds itself》内部数据则给出了「飞轮已经在转」的硬证据：

截至 2026 年 5 月，Anthropic 合入代码库的代码中，超过 80% 由 Claude 编写；2025 年 2 月 Claude Code 发布前，这一比例还是个位数。

2026 年二季度，一位典型工程师每天合并的代码量是 2024 年的 8 倍。

内部 130 名研究人员调查显示，产出中位数为「无 AI 时的 4 倍」。

在最开放、最模糊的编程任务上，Claude 成功率半年内从 26% 升至 76%。

优化小型 AI 训练代码的任务中，2025 年 5 月 Claude Opus 4 做到 3 倍加速；2026 年 4 月 Claude Mythos Preview 干到 52 倍——而熟练人类研究员需要 4 到 8 小时才能做到 4 倍。

哈萨比斯与 Altman：全员入场，节奏比预期更快

倒计时已启动