Agent4cs：面向大型层级代码库的多智能体摘要框架

arXiv 上一篇新论文提出了名为 Agent4cs 的多智能体框架，专门用于对大型、结构复杂的代码库进行自动化摘要。该研究针对现有方案将源码视为扁平文本、未充分利用仓库内部层级与依赖关系的不足，设计了一套自底向上（bottom-up）的分层摘要流程。

核心思路：三智能体分工协作

Agent4cs 框架由三类智能体协同完成摘要任务：

摘要智能体（summarization agent）：聚焦于为每个代码单元生成稳健的摘要文本。
关键词提取智能体（keyword-extraction agent）：主动从子文件夹中识别关键信息，补全摘要中的语义要素。
质量保证智能体（quality-assurance agent）：对前述输出进行迭代优化，提升可读性、连贯性与完整性。

三个智能体各司其职，配合层级化的处理方式，使框架能够逐层向上聚合信息，最终输出覆盖整个代码库的摘要。

实验设置与关键结果

研究团队在 7 个前沿大模型上对 Agent4cs 进行了评估，并以两种基于结构化提示与代码段的方法作为基线。实验覆盖真实世界数据集，重点考察两个维度：

语义一致性：在所有文件夹层级上，Agent4cs 相较基线平均提升约 8%。
关键词覆盖率：归一化关键词覆盖率最高可获得 38% 的增益。

研究意义与局限

代码摘要长期以来是软件工程与 LLM 应用交叉领域的难题，大型仓库往往存在结构复杂、文档缺失甚至被刻意混淆等问题。Agent4cs 的多智能体+层级化方案为这一方向提供了新的工程思路。不过，目前公开内容仅为 arXiv 预印本摘要，尚未披露完整的代码、提示词模板与逐项基准对比细节，后续需结合论文正文与开源仓库进一步评估其泛化能力与实际部署成本。