桃子桃子快讯
返回首页
行业动态

AI Agent 的「Loop 工程」:自己干活、自己返工

吴恩达等推动的 Loop 工程成为 Agent 新共识,用户不再写提示词,而是为 Agent 设计运行循环,降低使用门槛…

2026.07.03 · 周五6 分钟阅读

近一个月,从吴恩达在 X 上的推文,到 Anthropic 官方博客,再到 GitHub 上 OpenClaw(龙虾)创始人 Peter Steinberger 的讨论,「Loop 工程」一词在 AI Agent 圈集中走红。它的核心主张是:与其给 Coding Agent 一条一条写提示词,不如为它设计一套让任务自己「转起来」的循环机制。从 Claude Code、Codex 到智谱的 ZCode,主流 Agent 产品都已经在按这种思路迭代。

从提示词到 Harness 再到 Loop,Agent 多了什么

过去两年,AI 使用的核心议题一直是提示词工程。用户给模型写需求、拆步骤、改错误,模型执行。但在 Agent 时代,模型不仅要回答,还要自己决定什么时候读文件、跑命令、查网页或停下来确认,提示词工程和思维链已不够用。

围绕这一缺口,先出现了 Harness 工程。它相当于套在模型外层的运行框架,负责接管工具调用、权限管理、上下文装载和状态存储。模型仍然负责推理与生成,但被放进了一个可以执行任务的环境里。

Loop 工程则在此基础上再进一步,关注如何让 Agent 围绕一个目标不断循环。用户给出目标,Agent 理解任务、获取上下文、调用工具、观察结果、判断是否完成;未完成就修改、重跑、再检查,整个过程像人类员工「先做一版、再发现并修补问题」的日常。所以 Loop 的关键不在「循环」二字,而在循环里到底装了什么——权限系统、上下文压缩、插件、skills、hooks、子 Agent、会话存储,这些工程组件才是 Agent 能自己转起来的托底支撑。

四种 Loop 原语

Anthropic 在 6 月底的博客中,把 Claude Code 里的 Loop 拆成四种原语:

  • turn-based(回合制):用户每发一条消息,Agent 回应一条,本质仍是人驱动循环。
  • goal-based(目标驱动):用户给一个目标,Agent 自己写、测试、修改,例如「帮我写一个登录页面」。
  • time-based(定时触发):Agent 按固定周期自动执行任务,例如每两小时检查某个 PR 并 review。
  • proactive(主动式):Agent 自己发现问题并开干,例如发现测试覆盖率下降后自动补齐测试用例。

其中 goal-based 和 proactive 是 Agent 产品目前的主攻方向。OpenAI 的 Codex 已不只提供「帮你写代码」的入口,而是在独立环境中读仓库、改文件、跑测试、再把日志与结果交回。Anthropic 的 Claude Code 则几乎是 Loop 工程的最佳样板。Boris Cherny 提出的「不再自己写提示词,而是让一个 Agent 去提示 Claude」,正反映出 Loop 时代人机分工的转变。

对普通用户:为什么是「杀死提示词」

Loop 工程带来的最直接变化,是降低提示词设计门槛。过去使用 AI 像带一个聪明但缺乏经验的实习生,需要逐句指挥;Loop 做得好的 Agent 更像已经熟悉工作流程的同事,不需要每次提醒它「报错就继续修」,因为测试与返工本身就是循环的一部分。用户也不再需要把所有上下文一次性塞进对话框,Agent 可借助文件系统、搜索工具、记忆与索引逐步获取所需信息。

这会改变用户与 AI 的关系。以前用户经常要同时扮演产品经理、项目经理、测试和老师,给需求、拆步骤、盯进度、改错误;以后用户更像设目标和验收结果的人。例如做一次东京 5 天的旅行规划,过去可能需要写明预算、天数、查机票、查酒店、注意交通、给表格、再总结;Loop 成熟之后,用户只需要说「下个月去东京 5 天,预算中等,少折腾多看展」,Agent 自己查时间、比价、排路线、发现冲突、出方案,在收到「第二天太满」这类反馈后还能自动重排。

之所以软件工程场景最先被 Loop 打穿,是因为它的反馈闭环天然清晰:目标可以写成 issue,过程可以拆成文件修改,工具可以跑测试,结果可以用 diff 和 CI 验证。研究、表格、PPT、数据分析、客服工单、法务检索、招聘筛选、运营监控等场景,同样具备「任务不止一句话、但成功标准可写、过程可记录、结果可检查」的特征,是 Loop 工程的下一片潜在战场。

另一方面,Loop 也给了可靠性一个抓手:为什么搜索这个页面、为什么修改这个文件、为什么调用这个工具、为什么判断任务已完成,这些决策可以被记录,修复可以沉淀为 skill,项目规则可以写入 AGENTS.md、CLAUDE.md 这类记忆文件,下次再做同类任务就不必重新摸索。当然前提是 Loop 本身要被正确设计——一个糟糕的 Loop,只会更快地复制错误。

写在最后

过去三年,使用 AI 的方式经历了多次变化,但底层逻辑没变:人发指令,AI 执行,人判断结果,人始终是循环的中心。Loop 工程第一次把人从循环中心移到循环外面,用户从司机变成导航。这一变化对开发者的核心能力要求,将从「实现」转向「定义问题、设计验收标准」;对产品团队而言,技术不再是瓶颈,判断力才是真正的竞争点。

不过,所有这些都建立在一个前提上:模型还得继续变强。Loop 能转多少圈、能处理多复杂的任务,最终取决于模型的基础能力。如果模型跑个三五步就偏航,再精巧的 Loop 设计也无济于事。好在今年 GPT-5.5、Claude 5、GLM-5.2、M3、K2.6、DeepSeek V4 等几代主流模型仍在快速迭代,Agent 能力每一代都有可见提升。模型越来越强,Loop 越转越顺,人越来越往外退——这个趋势的轮廓已经清晰。AI 也因此可能从「工具」进一步走向「协作者」:工具需要你懂怎么用、每一步怎么操作;协作者只需要你告诉它目标,它会自己想办法和你一起把事做成。

信源