AI 智能体记忆机制综述：形式、功能与动态全景

来自复旦大学、牛津大学等多机构的研究团队在 arXiv 上联合发布了题为《Memory in the Age of AI Agents》的综述论文（arXiv:2512.13564），系统梳理了大模型智能体（agent）记忆领域的最新研究进展，并提出了一套统一的分析框架。论文指出，随着智能体研究的快速扩张，相关记忆研究在动机、实现路径和评测方法上趋于碎片化，传统的长/短期记忆分类已不足以刻画当代系统的多样性。

研究范围与核心概念

论文首先明确界定了「智能体记忆」的边界，并将其与若干邻近概念区分开来：

LLM 记忆：关注模型参数层面的知识存储与调用。
检索增强生成（RAG）：以外部知识库补充上下文。
上下文工程（Context Engineering）：偏重提示与上下文窗口的构造。

智能体记忆则强调在多轮、多任务、自主行动过程中持续维护与调用信息的能力，是支撑智能体长期一致性的核心机制。

统一分析框架：形式、功能与动态

为整合现有工作，论文从三个互补视角构建分类体系：

形式（Forms）：将记忆实现归纳为三类——token-level（显式文本或向量记忆）、parametric（参数化记忆）和 latent（潜在表征记忆）。
功能（Functions）：提出更细粒度的功能分类，包括事实记忆（factual）、经验记忆（experiential）和工作记忆（working）。
动态（Dynamics）：分析记忆在生命周期中如何形成、演化与检索。

这种三维框架使研究者能够横向比较不同方案的设计取舍。

基准与开源资源汇总

为支撑后续工程开发，论文汇编了当前可用的记忆相关评测基准与开源框架，覆盖从静态问答到长期交互式任务的多类场景。文中同时指出现有评测在任务多样性、跨任务一致性和长程依赖评估方面仍有缺口。

前沿方向

论文进一步梳理了若干新兴研究主题：

记忆自动化：让模型自主决定写入、压缩与遗忘。
与强化学习的结合：将记忆作为可学习的策略组件。
多模态记忆：跨文本、图像、音频的统一记忆表示。
多智能体共享记忆：在协作场景下实现安全可追溯的信息交换。
可信性与安全性：记忆污染、隐私泄露与对抗操纵风险。

作者表示，希望该综述不仅作为现有工作的参考索引，也能为将「记忆」重新定位为未来智能体系统的一类一等公民（first-class primitive）提供概念基础。论文 v2 版本已于 2026 年 1 月 13 日更新。