AI Agent 的「Loop 工程」：自己干活、自己返工

近一个月，从吴恩达在 X 上的推文，到 Anthropic 官方博客，再到 GitHub 上 OpenClaw（龙虾）创始人 Peter Steinberger 的讨论，「Loop 工程」一词在 AI Agent 圈集中走红。它的核心主张是：与其给 Coding Agent 一条一条写提示词，不如为它设计一套让任务自己「转起来」的循环机制。从 Claude Code、Codex 到智谱的 ZCode，主流 Agent 产品都已经在按这种思路迭代。

从提示词到 Harness 再到 Loop，Agent 多了什么

过去两年，AI 使用的核心议题一直是提示词工程。用户给模型写需求、拆步骤、改错误，模型执行。但在 Agent 时代，模型不仅要回答，还要自己决定什么时候读文件、跑命令、查网页或停下来确认，提示词工程和思维链已不够用。

围绕这一缺口，先出现了 Harness 工程。它相当于套在模型外层的运行框架，负责接管工具调用、权限管理、上下文装载和状态存储。模型仍然负责推理与生成，但被放进了一个可以执行任务的环境里。

Loop 工程则在此基础上再进一步，关注如何让 Agent 围绕一个目标不断循环。用户给出目标，Agent 理解任务、获取上下文、调用工具、观察结果、判断是否完成；未完成就修改、重跑、再检查，整个过程像人类员工「先做一版、再发现并修补问题」的日常。所以 Loop 的关键不在「循环」二字，而在循环里到底装了什么——权限系统、上下文压缩、插件、skills、hooks、子 Agent、会话存储，这些工程组件才是 Agent 能自己转起来的托底支撑。

四种 Loop 原语

Anthropic 在 6 月底的博客中，把 Claude Code 里的 Loop 拆成四种原语：

turn-based（回合制）：用户每发一条消息，Agent 回应一条，本质仍是人驱动循环。
goal-based（目标驱动）：用户给一个目标，Agent 自己写、测试、修改，例如「帮我写一个登录页面」。
time-based（定时触发）：Agent 按固定周期自动执行任务，例如每两小时检查某个 PR 并 review。
proactive（主动式）：Agent 自己发现问题并开干，例如发现测试覆盖率下降后自动补齐测试用例。

其中 goal-based 和 proactive 是 Agent 产品目前的主攻方向。OpenAI 的 Codex 已不只提供「帮你写代码」的入口，而是在独立环境中读仓库、改文件、跑测试、再把日志与结果交回。Anthropic 的 Claude Code 则几乎是 Loop 工程的最佳样板。Boris Cherny 提出的「不再自己写提示词，而是让一个 Agent 去提示 Claude」，正反映出 Loop 时代人机分工的转变。

对普通用户：为什么是「杀死提示词」

Loop 工程带来的最直接变化，是降低提示词设计门槛。过去使用 AI 像带一个聪明但缺乏经验的实习生，需要逐句指挥；Loop 做得好的 Agent 更像已经熟悉工作流程的同事，不需要每次提醒它「报错就继续修」，因为测试与返工本身就是循环的一部分。用户也不再需要把所有上下文一次性塞进对话框，Agent 可借助文件系统、搜索工具、记忆与索引逐步获取所需信息。

这会改变用户与 AI 的关系。以前用户经常要同时扮演产品经理、项目经理、测试和老师，给需求、拆步骤、盯进度、改错误；以后用户更像设目标和验收结果的人。例如做一次东京 5 天的旅行规划，过去可能需要写明预算、天数、查机票、查酒店、注意交通、给表格、再总结；Loop 成熟之后，用户只需要说「下个月去东京 5 天，预算中等，少折腾多看展」，Agent 自己查时间、比价、排路线、发现冲突、出方案，在收到「第二天太满」这类反馈后还能自动重排。

之所以软件工程场景最先被 Loop 打穿，是因为它的反馈闭环天然清晰：目标可以写成 issue，过程可以拆成文件修改，工具可以跑测试，结果可以用 diff 和 CI 验证。研究、表格、PPT、数据分析、客服工单、法务检索、招聘筛选、运营监控等场景，同样具备「任务不止一句话、但成功标准可写、过程可记录、结果可检查」的特征，是 Loop 工程的下一片潜在战场。

另一方面，Loop 也给了可靠性一个抓手：为什么搜索这个页面、为什么修改这个文件、为什么调用这个工具、为什么判断任务已完成，这些决策可以被记录，修复可以沉淀为 skill，项目规则可以写入 AGENTS.md、CLAUDE.md 这类记忆文件，下次再做同类任务就不必重新摸索。当然前提是 Loop 本身要被正确设计——一个糟糕的 Loop，只会更快地复制错误。

写在最后

过去三年，使用 AI 的方式经历了多次变化，但底层逻辑没变：人发指令，AI 执行，人判断结果，人始终是循环的中心。Loop 工程第一次把人从循环中心移到循环外面，用户从司机变成导航。这一变化对开发者的核心能力要求，将从「实现」转向「定义问题、设计验收标准」；对产品团队而言，技术不再是瓶颈，判断力才是真正的竞争点。

不过，所有这些都建立在一个前提上：模型还得继续变强。Loop 能转多少圈、能处理多复杂的任务，最终取决于模型的基础能力。如果模型跑个三五步就偏航，再精巧的 Loop 设计也无济于事。好在今年 GPT-5.5、Claude 5、GLM-5.2、M3、K2.6、DeepSeek V4 等几代主流模型仍在快速迭代，Agent 能力每一代都有可见提升。模型越来越强，Loop 越转越顺，人越来越往外退——这个趋势的轮廓已经清晰。AI 也因此可能从「工具」进一步走向「协作者」：工具需要你懂怎么用、每一步怎么操作；协作者只需要你告诉它目标，它会自己想办法和你一起把事做成。