Agent-Rigor：为 AI 编程助手引入工程纪律的技能框架

Agent-Rigor 是一个面向 AI 编程助手的工程纪律框架，由开发者社区发布在 GitHub 上。它针对当前 AI 编程 Agent 在实际项目中常见的「缺乏工程纪律」问题，提出了一套以纯 Markdown 形式组织的模块化技能体系，试图让 Agent 在编写代码时遵循规划、验证、原子化状态切换等成熟软件工程实践。框架兼容 Cursor、Claude Code、GitHub Copilot、Gemini CLI、Aider 等主流 AI 编程工具，集成方式简单：只需将 .agents/SYSTEM_CORE.md 指向对应工具的规则文件即可生效。

核心问题与设计动机

框架作者指出，AI 编程 Agent 当前的主要短板并非智力不足，而是缺乏工程纪律。常见问题包括：

跳过规划阶段，直接进入实现。
写出看似合理但遗漏边界情况的代码。
陷入「doom loop」，在错误方向上反复修补而不回退。
跨会话出现「上下文失忆」，遗忘之前积累的教训。

作者以一个对比场景说明动机：面对同一个 Bug，Agent A 会先形成假设、写最小修复、补回归测试并验证通过；Agent B 则可能连续尝试五个随机补丁直到测试碰巧通过。两者在常规基准上可能得分相同，但在生产环境中前者可靠，后者脆弱。Agent-Rigor 的目标就是强制 Agent 表现得像前者。

18 项技能的阶段划分

框架内置 18 项专门技能，由「Apex Kernel」按当前任务阶段动态加载，以节省上下文 Token。技能按 6 个阶段组织：

阶段一任务合成：需求提炼、策略分解、歧义追问协议。
阶段二执行引擎：收敛迭代、状态检查点、增量验证循环。
阶段三验证矩阵：五边形代码审计（安全、性能、边界、状态边界、类型）、熵减清理。
阶段四认知持久化：代码库结构地图、上下文生命周期管理、源码位置验证。
阶段五接口协议：有界观察、语义导航、关键决策时升级给用户。
阶段六自适应协议：递归自纠正、范围围栏、经验整合、级联编排。

每个技能都附带可验证的执行步骤与退出条件，并预设了对常见 AI 「偷懒」行为的反例拦截机制。

评测与生态

项目配套发布了 RigorBench（arXiv:2606.22678），覆盖 100 个任务、4 套 Agent Harness，用于量化评估 AI 编程助手的纪律性表现，仓库中提供实时 RigorScore 排行榜。原文中评测结果表格被截断，详细数字未在公开摘要中给出。

总体而言，Agent-Rigor 的形态更接近「高级 Prompt + 规则集」，对希望提升 AI 编程 Agent 可靠性的开发者有一定参考价值，但其作者并非主流厂商，影响力目前仍局限于小众社区。