Mnemosyne：为 AI 生成工作流引入事务处理，约束不可信动作的提交与回滚

随着大语言模型驱动的 agent 越来越多地生成工作流动作、修复方案与执行计划，如何确保这些「AI 提案」在被执行时既语义合法、又不破坏系统状态，成为关键挑战。arXiv 上的一篇新论文提出了 Agentic Transaction Processing（ATP），将事务模型的思路引入 agent 运行时，对 AI 生成的动作施加确定性的接纳与提交约束。

核心思路：提案与接纳分离

ATP 的设计原则是「两端分离」：任何来源——包括 LLM、求解器或 agent 团队——都可以提出动作，但只有运行时在声明式、可执行约束集 C 下进行确定性校验后，才能将动作真正提交到状态中。若运行时遇到未预见的中断，则在 C 限定的范围内进行受控的响应式修复，而不是再次信任一个「新提案」。论文强调，提交后状态相对于 C 的正确性，将与提案层的「能力、诚实度或学习能力」解耦。

Mnemosyne 运行时

作者团队将 ATP 实现在 Mnemosyne 运行时中，关键组件包括：

仅追加的转换日志（append-only transition log）
有效状态投影（effective-state projection）
依赖安全的补偿机制（dependency-safe compensation）
主动承诺记录（active commitment records）

论文给出四项相对于 C 的安全性质证明：权限分离（authority separation）、串行等价生成接纳（serial-equivalent generative admission）、证据保留修复（evidence-preserving repair）和义务包含（obligation containment），并对本地化修复协议 LCRP 给出了有界响应式修复保证。

实证结果

论文附带可复现的工件，在九项伪证（falsification）测试中成功拦截了目标违规，同时仍接纳合法工作流；投影与校验开销低于 6%；有界局部修复的编辑操作数比全局重算少一个数量级。

开源与获取

Mnemosyne 已开源，代码地址为 https://github.com/eyuchang/Mnemosyne/tree/arxiv-atp-rq1-rq9b-r8-v2，便于研究者复现与拓展。对于正在构建可靠 agent 系统的工程团队而言，这一框架提供了一条将「AI 提案」视作不可信输入、并在系统层进行约束提交与安全修复的可参考路径。