研究提出 CoPref 框架：AI 智能体应帮用户构建偏好，而非仅被动询问

核心观点：从「询问偏好」到「帮助构建偏好」

现有的 AI 智能体（agent）在面对用户时，通常默认对方是「专家用户」——即对自己想要什么有清晰、完整、可直接陈述的偏好。当任务描述不够明确时，智能体的标准做法是发起澄清性提问。然而，arXiv 上发表的一篇论文指出，这一假设在现实中并不成立：用户往往缺乏必要的领域知识，无法在被直接询问时给出有意义的回答；他们需要智能体通过示例、解释等方式，帮助自己先习得相关知识，才能逐步形成对某项特征的偏好。

这一立场将智能体的角色从「偏好提取者」重新定位为「偏好构建的合作者」，对智能体设计与评估提出了新的要求。

CoPref：基于信息经济学的偏好构建模型

为将上述直觉形式化，作者借用了信息经济学中的「搜索—体验—信任品（Search-Experience-Credence）」框架，并在此基础上提出 CoPref 模型，用以刻画用户如何在与智能体的多轮对话中逐步构建起自身的偏好。

搜索品（Search）属性：用户在购买前可通过查阅信息即可了解的特征；
体验品（Experience）属性：需使用后才能评价的特征；
信任品（Credence）属性：即便使用后也难以判断好坏、需依赖专家讲解的特征。

CoPref 的核心主张是：对于后两类属性，用户的偏好并不是事先存在的，而是依赖智能体的对话行为（如举例、解释、对比）才能被「构建」出来。换言之，智能体的交互策略本身会影响用户最终表达出的需求。

CoShop：面向推荐场景的交互基准

为了让上述想法可被具体验证，作者提出了 CoShop，一个面向智能体推荐系统（agentic recommender systems）的交互式基准。在 CoShop 中，智能体需要与一个 CoPref 模拟用户进行多轮对话，并在交互结束后给出推荐。其表现优劣取决于它能否在对话过程中帮助用户获取「足以明确任务」的领域知识。

这一设定把评测焦点从「能不能找到正确答案」转向「能不能让用户说出正确答案」，对智能体的对话策略提出了更高要求。

实验结果：五轮交互后仍不足 56%

作者在五个前沿模型上评估了 CoShop，关键发现如下：

在最多五轮的交互条件下，没有任何智能体的准确率超过 56%；
失败原因并非智能体「找不到候选物品」，而是多轮交互对用户认知的扩展非常有限；
这意味着即便具备强大的检索或推荐能力，智能体若不能在对话阶段帮助用户构建偏好，最终推荐质量仍会受限。

这一结果为当前以「澄清式提问」为主的智能体交互范式敲响了警钟，也为后续研究指出了方向：未来的智能体设计需要更主动地承担「教学与解释」的角色，而不仅仅是被动地等待用户表态。