Janus：面向AI智能体的用户参与式权限管理评测平台

随着AI智能体（agent）逐步具备自主调用工具的能力，如何在执行过程中合理管理权限成为不可回避的问题：当智能体代替用户触发外部操作时，用户应当扮演什么角色、能在多大程度上介入决策，仍缺乏系统性的研究框架。近日发表于arXiv的论文《Janus: a Playground for User-Involved Agentic Permission Management》正是针对这一缺口提出了一套可实现的实验与评估方案。

研究动机：用户角色在智能体权限中被低估

论文指出，现有关于智能体权限管理的工作多集中在系统侧策略与模型侧对齐，用户的主动参与长期处于被忽视的位置。作者认为，权限决策本质上是人机协同任务，用户的判断与反馈不应仅作为兜底环节，而应被纳入设计轴心。基于这一认识，论文构建了一个概念模型，识别出用户介入程度、AI辅助强度、决策时机等关键设计维度。

系统设计：Janus-Core 与 Janus-Harness 双组件

Janus整体由两部分组成：

Janus-Core：模块化的智能体系统底座，支持多种权限管理设计方案的快速实现，研究者可灵活替换关键模块。
Janus-Harness：自动化评估框架，可在统一条件下对不同方案进行可重复的对比测试。

依托上述架构，作者沿设计空间实现了6款权限助手（permission assistants），并将其部署在3类典型场景与3种合成响应者行为模型上进行系统评估。

核心发现：用户参与不可或缺，但设计需因地制宜

论文通过实验得出若干明确结论：

用户输入对隐私与安全具有显著增益，是权限链路中不可省略的一环。
AI对用户决策的增强（如提示、解释、默认建议）可有效降低认知负担。
现实中的「权限疲劳」（permission fatigue）会显著影响用户参与质量，系统设计必须将其纳入考量。

更重要的是，论文强调：没有任何一种权限助手设计能在所有场景下同时取得最优表现。这一结论指向更具原则性、上下文敏感的部署方式，而非追求「一刀切」的最优解。

开源与后续研究

Janus已公开提供，供后续研究者复用与扩展。该工作定位为「playground」，意在为智能体权限管理这一方向建立可比较、可复现的实验基础，推动从零散实践走向系统化研究。