桃子桃子 AI 快讯
返回首页
研究论文

研究提出 CoPref 框架:AI 智能体应帮用户构建偏好,而非仅被动询问

arXiv 论文提出 CoPref 模型与 CoShop 基准,评估五个前沿模型后发现五轮交互内准确率均未超过 56%,…

2026.07.01 · 周三3 分钟阅读

核心观点:从「询问偏好」到「帮助构建偏好」

现有的 AI 智能体(agent)在面对用户时,通常默认对方是「专家用户」——即对自己想要什么有清晰、完整、可直接陈述的偏好。当任务描述不够明确时,智能体的标准做法是发起澄清性提问。然而,arXiv 上发表的一篇论文指出,这一假设在现实中并不成立:用户往往缺乏必要的领域知识,无法在被直接询问时给出有意义的回答;他们需要智能体通过示例、解释等方式,帮助自己先习得相关知识,才能逐步形成对某项特征的偏好。

这一立场将智能体的角色从「偏好提取者」重新定位为「偏好构建的合作者」,对智能体设计与评估提出了新的要求。

CoPref:基于信息经济学的偏好构建模型

为将上述直觉形式化,作者借用了信息经济学中的「搜索—体验—信任品(Search-Experience-Credence)」框架,并在此基础上提出 CoPref 模型,用以刻画用户如何在与智能体的多轮对话中逐步构建起自身的偏好。

  • 搜索品(Search)属性:用户在购买前可通过查阅信息即可了解的特征;
  • 体验品(Experience)属性:需使用后才能评价的特征;
  • 信任品(Credence)属性:即便使用后也难以判断好坏、需依赖专家讲解的特征。

CoPref 的核心主张是:对于后两类属性,用户的偏好并不是事先存在的,而是依赖智能体的对话行为(如举例、解释、对比)才能被「构建」出来。换言之,智能体的交互策略本身会影响用户最终表达出的需求。

CoShop:面向推荐场景的交互基准

为了让上述想法可被具体验证,作者提出了 CoShop,一个面向智能体推荐系统(agentic recommender systems)的交互式基准。在 CoShop 中,智能体需要与一个 CoPref 模拟用户进行多轮对话,并在交互结束后给出推荐。其表现优劣取决于它能否在对话过程中帮助用户获取「足以明确任务」的领域知识。

这一设定把评测焦点从「能不能找到正确答案」转向「能不能让用户说出正确答案」,对智能体的对话策略提出了更高要求。

实验结果:五轮交互后仍不足 56%

作者在五个前沿模型上评估了 CoShop,关键发现如下:

  • 在最多五轮的交互条件下,没有任何智能体的准确率超过 56%;
  • 失败原因并非智能体「找不到候选物品」,而是多轮交互对用户认知的扩展非常有限;
  • 这意味着即便具备强大的检索或推荐能力,智能体若不能在对话阶段帮助用户构建偏好,最终推荐质量仍会受限。

这一结果为当前以「澄清式提问」为主的智能体交互范式敲响了警钟,也为后续研究指出了方向:未来的智能体设计需要更主动地承担「教学与解释」的角色,而不仅仅是被动地等待用户表态。

信源