桃子桃子快讯
返回首页
工具

Agent-Rigor:为 AI 编程助手引入工程纪律的技能框架

Agent-Rigor 是一个模块化 AI 编程助手技能框架,包含 18 项分阶段技能,并在 RigorBench 基准…

2026.07.02 · 周四3 分钟阅读

Agent-Rigor 是一个面向 AI 编程助手的工程纪律框架,由开发者社区发布在 GitHub 上。它针对当前 AI 编程 Agent 在实际项目中常见的「缺乏工程纪律」问题,提出了一套以纯 Markdown 形式组织的模块化技能体系,试图让 Agent 在编写代码时遵循规划、验证、原子化状态切换等成熟软件工程实践。框架兼容 Cursor、Claude Code、GitHub Copilot、Gemini CLI、Aider 等主流 AI 编程工具,集成方式简单:只需将 .agents/SYSTEM_CORE.md 指向对应工具的规则文件即可生效。

核心问题与设计动机

框架作者指出,AI 编程 Agent 当前的主要短板并非智力不足,而是缺乏工程纪律。常见问题包括:

  • 跳过规划阶段,直接进入实现。
  • 写出看似合理但遗漏边界情况的代码。
  • 陷入「doom loop」,在错误方向上反复修补而不回退。
  • 跨会话出现「上下文失忆」,遗忘之前积累的教训。

作者以一个对比场景说明动机:面对同一个 Bug,Agent A 会先形成假设、写最小修复、补回归测试并验证通过;Agent B 则可能连续尝试五个随机补丁直到测试碰巧通过。两者在常规基准上可能得分相同,但在生产环境中前者可靠,后者脆弱。Agent-Rigor 的目标就是强制 Agent 表现得像前者。

18 项技能的阶段划分

框架内置 18 项专门技能,由「Apex Kernel」按当前任务阶段动态加载,以节省上下文 Token。技能按 6 个阶段组织:

  • 阶段一 任务合成:需求提炼、策略分解、歧义追问协议。
  • 阶段二 执行引擎:收敛迭代、状态检查点、增量验证循环。
  • 阶段三 验证矩阵:五边形代码审计(安全、性能、边界、状态边界、类型)、熵减清理。
  • 阶段四 认知持久化:代码库结构地图、上下文生命周期管理、源码位置验证。
  • 阶段五 接口协议:有界观察、语义导航、关键决策时升级给用户。
  • 阶段六 自适应协议:递归自纠正、范围围栏、经验整合、级联编排。

每个技能都附带可验证的执行步骤与退出条件,并预设了对常见 AI 「偷懒」行为的反例拦截机制。

评测与生态

项目配套发布了 RigorBench(arXiv:2606.22678),覆盖 100 个任务、4 套 Agent Harness,用于量化评估 AI 编程助手的纪律性表现,仓库中提供实时 RigorScore 排行榜。原文中评测结果表格被截断,详细数字未在公开摘要中给出。

总体而言,Agent-Rigor 的形态更接近「高级 Prompt + 规则集」,对希望提升 AI 编程 Agent 可靠性的开发者有一定参考价值,但其作者并非主流厂商,影响力目前仍局限于小众社区。

信源