桃子桃子快讯
返回首页
产品功能

AWS Bedrock AgentCore Memory 新增元数据过滤,检索准确率提升显著

AWS 为 Bedrock AgentCore Memory 引入元数据过滤能力,在 151 题测试集上将问答准确率从…

2026.07.02 · 周四3 分钟阅读

Amazon Bedrock AgentCore Memory 是 AWS 提供的一项托管记忆服务,旨在让 AI Agent 跨会话记住并回溯信息。近日,AWS 官方博客介绍了该服务新增的「元数据过滤(metadata filtering)」能力,允许在命名空间隔离之上叠加基于属性的细粒度过滤条件,从而让检索结果更精准地匹配业务维度(如优先级、部门、时间范围等)。

为什么需要元数据过滤

在命名空间实现实体级隔离之后,语义相似度检索仍会返回大量语义相近但语境无关的记忆。以客服 Agent 为例:当用户询问「账单问题」时,系统可能同时返回技术支持工单、含收据争议的销售对话以及账单纠纷记录——这些结果在语义上都与「账单」相关,但缺少对问题类型、状态或时间等维度的过滤。

随着记忆库持续累积(数周到数月的交互历史),相关信号会被语义相似但语境无关的结果淹没,仅靠命名空间无法区分。AWS 在官方评测中验证了这一痛点:在基于 LoCoMo 风格多会话对话构建的 151 题测试集上,启用元数据过滤后,整体问答准确率从 40% 提升至 64%。在依赖语境边界(如时间限定、优先级筛选、部门限定)的子集上,准确率从 16% 跃升至 69%。

元数据的三个生命周期阶段

配置阶段

创建 Memory 资源时,需声明需要索引的元数据键(key),以便后续高效过滤与检索。每个记忆策略可定义元数据 schema,指导系统在提取与解析阶段如何处理元数据值。索引键以专为查询过滤优化的格式存储,非索引键则与记忆记录一同保存,仅作信息性用途。

摄入阶段

在数据写入(ingestion)时,可由调用方显式附加元数据,也可由底层模型根据内容推断。对于短时记忆,元数据以字符串键值对附加到事件(event)上,并在提取与合并阶段延续到长时记忆,成为可过滤的维度。

检索阶段

查询时,在相似度搜索执行之前先按元数据条件做属性级过滤,从而把检索范围限定到所需的业务维度。AWS 强调:命名空间解决的是「who」级别的逻辑隔离,元数据过滤则在该边界内进一步处理子分组(类别、解决状态、日期、优先级、标签等)。

适用场景

  • 多租户架构:在每个租户命名空间内部,IT 帮助台 Agent 仍需按工单类型等元数据过滤后再搜索解决方案模板。
  • 金融顾问场景:当关系经理询问某客户的「投资组合再平衡讨论」时,需要在客户命名空间内进一步按投资策略、时间段、优先级等元数据过滤。

小结

元数据过滤补齐了 AgentCore Memory 在「命名空间 → 语义检索」两级之间缺失的中间层,让企业级 Agent 能够在保持租户隔离的前提下,对长时记忆做更精细的结构化检索。对正在使用或评估 Bedrock AgentCore 的团队而言,这是一项直接降低误召率、提升回答准确度的实用能力。

信源