行业动态
一位 AI 研究者反思:智能体到底有没有用?
一位长期研究 LLM 智能体的学者撰文,质疑智能体在实际生活中的价值,并对比了乐观派与怀疑派的分歧。
2026.06.29 · 周一约 3 分钟阅读评分 29
评分细项加权总分 29
- 重要性
- 25
- 新颖性
- 30
- 影响面
- 25
- 可信度
- 50
- 实质性
- 22
一名长期研究大语言模型智能体(Agent)的科研人员近日撰文,以「The Usefulness of AI Agents」为题,从个人使用体验出发,质疑当下 AI 智能体的实际价值。文章并未带来新的技术或产品信息,更像是一篇带有学术背景的行业反思,发表后在 Hacker News 引发讨论。
研究者的「无智能体」日常
作者坦言,自己在工作中以研究智能体为生,必须大量实验编程类 Agent 来理解它们对软件工程的影响——这一点毫无争议。但他发现,关闭工作电脑之后,自己在生活中几乎没有让 AI 智能体代劳的需求。
- 他将这种「无感」归因于三点:享有的社会保障让他不必与机构纠缠、数字极简主义减少了屏幕使用、以及对「外包思考」本身的审慎态度。
- 他指出,很多人花大量时间和金钱使用 AI 工具,结果却是在电脑前花的时间更多,而非更少。
- 他也承认,个例中有不少人借助 LLM 应对繁琐的官僚流程,他并未否定这种个体层面的帮助,但强调个体收益与集体后果之间存在差异。
生产力 ≠ 价值
文章的核心争议围绕「价值」的定义展开。作者援引了多位行业评论者的观点:
- 乐观派方面,Simon Willison 多次表达 AI 智能体显而易见的价值;Matt Shumer 在《Something Big Is Happening》中呼吁人们每天花固定时间使用 AI;Dario Amodei 的《The Adolescence of Technology》进一步助推了技术乐观情绪。
- 怀疑派方面,Ed Zitron 今年早些时候在 BlueSky 上尖锐质疑 AI 只能让「一些工程师更快地做些事」。作者认为 Zitron 真正在表达的是:开发者效率的简单提升并不等于价值提升,而价值无法用代码行数或开发速度来衡量。
作者特别指出,美式话语倾向于将「价值」等同于生产力与经济增长的单一维度,而欧洲视角则更注重生活质量,这种差异在 AI 讨论中尤为明显。
「紧迫感」从何而来
作者认为,AI 工具的「紧迫感」很大程度上被商业叙事放大了:
- 行业迭代极快,小规模实验很快被新模型和大型公司发布的新工具所淘汰。
- 但由于开源权重与开源软件的存在,大多数改进最终都会公开,技术护城河难以长期维持。
- 真正需要警惕的,是企业管理层「先采用再评估」的冲动——在没有弄清「为何用、怎么用、成本几何」之前就全面铺开。
文章最后,作者重申他对 AI 技术本身保持关注,但对其当前能带来的真实益处仍持保留态度。他写道,AI 的真实收益对他来说尚不清晰,但了解技术的能力边界确实重要。
