字节跳动发现智能体新扩展定律：每三个月学习速度可翻倍

字节跳动旗下 Seed AI 团队于本周四发表研究论文，提出了一条关于 AI 智能体能力提升的新扩展定律：在真实环境中持续执行任务，智能体的学习速度大约每三个月可以翻倍。这一发现为在传统「堆数据 + 堆算力」路径遭遇瓶颈之际，AI 行业寻找下一阶段增长曲线提供了新的思路。

新定律的核心结论

论文指出，与依赖预训练阶段投入更多数据和算力的传统方式不同，已经部署到真实场景中的 AI 智能体（即可以自主代表人类执行任务的软件系统），能够在与现实环境的长期交互中持续学习。研究团队的量化结果显示，这种学习速度遵循一条清晰的扩展曲线——每经过约三个月，与真实环境的交互就能使智能体能力再上一个台阶。

为什么这条定律值得关注

近年来，「scaling law」一直是推动大模型性能跃迁的核心动力，但多位行业人士已公开警示这一路径并非无限。OpenAI 联合创始人 Andrej Karpathy 等人就曾指出，单纯依靠更多数据和算力的「暴力」方式终将触顶。与此同时，美国研究机构 Epoch AI 近期发出警告：公开可用的、由人类生成的文本数据可能在未来六年内耗尽。在这种背景下，智能体通过与环境交互自主积累经验、形成「经验数据」的范式，被视为一条极具潜力的替代路径。

字节跳动研究人员在论文中也坦率承认，相比传统预训练阶段已经较为成熟的研究范式，智能体「在部署后如何从真实环境中学习，目前仍然远远未被充分理解」。这正是他们希望填补的研究空白。

EdgeBench：配套发布的超长时基准

为了让上述定律可被量化、可被复现，团队同步推出了名为 EdgeBench 的基准测试套件，主要特点如下：

包含 134 个超长时（ultra-long-horizon）任务
覆盖软件工程、科学发现、形式化数学、专业知识工作等多元领域
每个任务至少需要智能体连续运行 12 小时以上

EdgeBench 的设计目标，是让研究者能够直接观察智能体在长时间跨度内的学习与决策行为，从而为验证和迭代「真实环境扩展定律」提供标准化的实验土壤。

对行业的潜在影响

如果这一规律在更大范围内得到验证，意味着 AI 能力的提升不必再完全押注预训练阶段的资源投入，而是可以通过部署后的持续运行来延续增长曲线。这对智能体产品的迭代节奏、评测方式以及算力分配策略都可能产生深远影响。不过，新定律目前仍处于早期研究阶段，能否复现、能否推广到不同任务域，仍有待社区进一步检验。