桃子桃子快讯
返回首页
研究论文

Mnemosyne:为 AI 生成工作流引入事务处理,约束不可信动作的提交与回滚

arXiv 新论文提出 Agentic Transaction Processing 模型,把 AI 生成的动作视作不可…

2026.07.02 · 周四3 分钟阅读

随着大语言模型驱动的 agent 越来越多地生成工作流动作、修复方案与执行计划,如何确保这些「AI 提案」在被执行时既语义合法、又不破坏系统状态,成为关键挑战。arXiv 上的一篇新论文提出了 Agentic Transaction Processing(ATP),将事务模型的思路引入 agent 运行时,对 AI 生成的动作施加确定性的接纳与提交约束。

核心思路:提案与接纳分离

ATP 的设计原则是「两端分离」:任何来源——包括 LLM、求解器或 agent 团队——都可以提出动作,但只有运行时在声明式、可执行约束集 C 下进行确定性校验后,才能将动作真正提交到状态中。若运行时遇到未预见的中断,则在 C 限定的范围内进行受控的响应式修复,而不是再次信任一个「新提案」。论文强调,提交后状态相对于 C 的正确性,将与提案层的「能力、诚实度或学习能力」解耦。

Mnemosyne 运行时

作者团队将 ATP 实现在 Mnemosyne 运行时中,关键组件包括:

  • 仅追加的转换日志(append-only transition log)
  • 有效状态投影(effective-state projection)
  • 依赖安全的补偿机制(dependency-safe compensation)
  • 主动承诺记录(active commitment records)

论文给出四项相对于 C 的安全性质证明:权限分离(authority separation)、串行等价生成接纳(serial-equivalent generative admission)、证据保留修复(evidence-preserving repair)和义务包含(obligation containment),并对本地化修复协议 LCRP 给出了有界响应式修复保证。

实证结果

论文附带可复现的工件,在九项伪证(falsification)测试中成功拦截了目标违规,同时仍接纳合法工作流;投影与校验开销低于 6%;有界局部修复的编辑操作数比全局重算少一个数量级。

开源与获取

Mnemosyne 已开源,代码地址为 https://github.com/eyuchang/Mnemosyne/tree/arxiv-atp-rq1-rq9b-r8-v2,便于研究者复现与拓展。对于正在构建可靠 agent 系统的工程团队而言,这一框架提供了一条将「AI 提案」视作不可信输入、并在系统层进行约束提交与安全修复的可参考路径。

信源