AWS Bedrock AgentCore Memory 新增元数据过滤，检索准确率提升显著

Amazon Bedrock AgentCore Memory 是 AWS 提供的一项托管记忆服务，旨在让 AI Agent 跨会话记住并回溯信息。近日，AWS 官方博客介绍了该服务新增的「元数据过滤（metadata filtering）」能力，允许在命名空间隔离之上叠加基于属性的细粒度过滤条件，从而让检索结果更精准地匹配业务维度（如优先级、部门、时间范围等）。

为什么需要元数据过滤

在命名空间实现实体级隔离之后，语义相似度检索仍会返回大量语义相近但语境无关的记忆。以客服 Agent 为例：当用户询问「账单问题」时，系统可能同时返回技术支持工单、含收据争议的销售对话以及账单纠纷记录——这些结果在语义上都与「账单」相关，但缺少对问题类型、状态或时间等维度的过滤。

随着记忆库持续累积（数周到数月的交互历史），相关信号会被语义相似但语境无关的结果淹没，仅靠命名空间无法区分。AWS 在官方评测中验证了这一痛点：在基于 LoCoMo 风格多会话对话构建的 151 题测试集上，启用元数据过滤后，整体问答准确率从 40% 提升至 64%。在依赖语境边界（如时间限定、优先级筛选、部门限定）的子集上，准确率从 16% 跃升至 69%。

元数据的三个生命周期阶段

配置阶段

创建 Memory 资源时，需声明需要索引的元数据键（key），以便后续高效过滤与检索。每个记忆策略可定义元数据 schema，指导系统在提取与解析阶段如何处理元数据值。索引键以专为查询过滤优化的格式存储，非索引键则与记忆记录一同保存，仅作信息性用途。

摄入阶段

在数据写入（ingestion）时，可由调用方显式附加元数据，也可由底层模型根据内容推断。对于短时记忆，元数据以字符串键值对附加到事件（event）上，并在提取与合并阶段延续到长时记忆，成为可过滤的维度。

检索阶段

查询时，在相似度搜索执行之前先按元数据条件做属性级过滤，从而把检索范围限定到所需的业务维度。AWS 强调：命名空间解决的是「who」级别的逻辑隔离，元数据过滤则在该边界内进一步处理子分组（类别、解决状态、日期、优先级、标签等）。

适用场景

多租户架构：在每个租户命名空间内部，IT 帮助台 Agent 仍需按工单类型等元数据过滤后再搜索解决方案模板。
金融顾问场景：当关系经理询问某客户的「投资组合再平衡讨论」时，需要在客户命名空间内进一步按投资策略、时间段、优先级等元数据过滤。

小结

元数据过滤补齐了 AgentCore Memory 在「命名空间 → 语义检索」两级之间缺失的中间层，让企业级 Agent 能够在保持租户隔离的前提下，对长时记忆做更精细的结构化检索。对正在使用或评估 Bedrock AgentCore 的团队而言，这是一项直接降低误召率、提升回答准确度的实用能力。