桃子桃子快讯
返回首页
工具

AWS 开源 Bedrock Model Profiler:一站式对比 100+ 基础模型

亚马逊云科技开源 Model Profiler,自动聚合 Bedrock 上 100+ 基础模型的能力、定价、配额与区域…

2026.07.02 · 周四4 分钟阅读

亚马逊云科技在官方机器学习博客发布并开源了 Amazon Bedrock Model Profiler,一款用于简化 Bedrock 平台上基础模型选型的 Web 工具。Bedrock 当前提供来自 Anthropic、OpenAI、Meta、Mistral AI、Cohere 和 Amazon 等厂商的 100 多款基础模型,但模型能力、价格、区域可用性、上下文窗口与吞吐量等信息分散在控制台、文档与各区域 API 中,给模型评估与迁移带来较高成本。Model Profiler 将这些数据聚合到单一可搜索界面,并提供高级筛选、并排对比与模型卡片展示能力。

数据来源与覆盖范围

Model Profiler 通过完全自动化的无服务器流水线,从 7 个数据源(5 个 AWS API + 2 个公开 URL)持续采集并处理元数据:

  • Amazon Bedrock ListFoundationModels API:覆盖 33 个区域的模型规格、能力、模态支持与区域可用性。
  • AWS Price List API:按需、批量与预留三种计费档位的价格。
  • AWS Service Quotas API:每分钟令牌数(TPM)与每分钟请求数(RPM)配额。
  • Amazon Bedrock ListInferenceProfiles API:跨区域推理配置与地理范围。
  • Amazon Bedrock Mantle API:Mantle 推理在各区域的可用性。
  • LiteLLM 模型数据库(公开 URL):上下文窗口与最大输出 token。
  • AWS 文档(公开 URL):模型生命周期状态(active / legacy / end-of-life)。

其中 TPM 衡量每分钟可处理的 token 数(约 1000 token ≈ 750 词),RPM 则限制 API 调用频次,两者均随模型与区域变化。

流水线架构

整个数据流水线由 AWS Step Functions 编排,包含 17 个 Lambda 函数,按 4 个阶段执行:

  • 阶段 0 初始化:动态发现支持 Bedrock 的 AWS 区域(不硬编码区域列表),初始化 S3 路径与缓存键,并同步前后端配置。
  • 阶段 1 并行采集:三条分支同时运行,分别抓取定价、模型清单与服务配额。
  • 阶段 2 并行增强:在缓存层之上并发执行 6 个增强步骤,完成价格-模型映射、区域可用性、跨区域推理判断、上下文窗口、Mantle 探测与生命周期判定。
  • 阶段 3 聚合发布:合并为两份 JSON——bedrock_models.json(完整模型目录)与 bedrock_pricing.json(按厂商/模型组织的价格),存入 S3 并通过 CloudFront 分发。

流水线每日 UTC 时间 6:00 运行一次,单次执行约 8–12 分钟。通过 Lambda 间 S3 缓存机制,API 调用次数从约 480 次降至 29 次,缓存命中率约 97%。发布前系统会扫描 7 类数据质量问题,超阈值时由基于 Bedrock 的自愈 Agent 分析并自动应用安全修复(原文在此处截断,未给出后续细节)。调度可通过 CloudFormation 模板中的 EventBridge 规则调整。

部署与价值

Model Profiler 以开源形式发布,用户可在自有 AWS 环境中于 5 分钟内完成部署。它适合正在评估新工作负载模型、进行成本与性能优化、或从其他 AI 系统迁移的团队,将原本散落在多份文档与模型卡片中的信息汇聚到统一界面,降低选型与迁移决策的门槛。

信源