桃子桃子快讯
返回首页
研究论文

字节跳动发现智能体新扩展定律:每三个月学习速度可翻倍

字节跳动 Seed 团队提出 AI 智能体通过真实环境交互实现能力扩展的新定律,并发布含 134 个超长时任务的 Edg…

2026.07.04 · 周六3 分钟阅读

字节跳动旗下 Seed AI 团队于本周四发表研究论文,提出了一条关于 AI 智能体能力提升的新扩展定律:在真实环境中持续执行任务,智能体的学习速度大约每三个月可以翻倍。这一发现为在传统「堆数据 + 堆算力」路径遭遇瓶颈之际,AI 行业寻找下一阶段增长曲线提供了新的思路。

新定律的核心结论

论文指出,与依赖预训练阶段投入更多数据和算力的传统方式不同,已经部署到真实场景中的 AI 智能体(即可以自主代表人类执行任务的软件系统),能够在与现实环境的长期交互中持续学习。研究团队的量化结果显示,这种学习速度遵循一条清晰的扩展曲线——每经过约三个月,与真实环境的交互就能使智能体能力再上一个台阶。

为什么这条定律值得关注

近年来,「scaling law」一直是推动大模型性能跃迁的核心动力,但多位行业人士已公开警示这一路径并非无限。OpenAI 联合创始人 Andrej Karpathy 等人就曾指出,单纯依靠更多数据和算力的「暴力」方式终将触顶。与此同时,美国研究机构 Epoch AI 近期发出警告:公开可用的、由人类生成的文本数据可能在未来六年内耗尽。在这种背景下,智能体通过与环境交互自主积累经验、形成「经验数据」的范式,被视为一条极具潜力的替代路径。

字节跳动研究人员在论文中也坦率承认,相比传统预训练阶段已经较为成熟的研究范式,智能体「在部署后如何从真实环境中学习,目前仍然远远未被充分理解」。这正是他们希望填补的研究空白。

EdgeBench:配套发布的超长时基准

为了让上述定律可被量化、可被复现,团队同步推出了名为 EdgeBench 的基准测试套件,主要特点如下:

  • 包含 134 个超长时(ultra-long-horizon)任务
  • 覆盖软件工程、科学发现、形式化数学、专业知识工作等多元领域
  • 每个任务至少需要智能体连续运行 12 小时以上

EdgeBench 的设计目标,是让研究者能够直接观察智能体在长时间跨度内的学习与决策行为,从而为验证和迭代「真实环境扩展定律」提供标准化的实验土壤。

对行业的潜在影响

如果这一规律在更大范围内得到验证,意味着 AI 能力的提升不必再完全押注预训练阶段的资源投入,而是可以通过部署后的持续运行来延续增长曲线。这对智能体产品的迭代节奏、评测方式以及算力分配策略都可能产生深远影响。不过,新定律目前仍处于早期研究阶段,能否复现、能否推广到不同任务域,仍有待社区进一步检验。

信源