AWS 开源 Bedrock Model Profiler：一站式对比 100+ 基础模型

亚马逊云科技在官方机器学习博客发布并开源了 Amazon Bedrock Model Profiler，一款用于简化 Bedrock 平台上基础模型选型的 Web 工具。Bedrock 当前提供来自 Anthropic、OpenAI、Meta、Mistral AI、Cohere 和 Amazon 等厂商的 100 多款基础模型，但模型能力、价格、区域可用性、上下文窗口与吞吐量等信息分散在控制台、文档与各区域 API 中，给模型评估与迁移带来较高成本。Model Profiler 将这些数据聚合到单一可搜索界面，并提供高级筛选、并排对比与模型卡片展示能力。

数据来源与覆盖范围

Model Profiler 通过完全自动化的无服务器流水线，从 7 个数据源（5 个 AWS API + 2 个公开 URL）持续采集并处理元数据：

Amazon Bedrock ListFoundationModels API：覆盖 33 个区域的模型规格、能力、模态支持与区域可用性。
AWS Price List API：按需、批量与预留三种计费档位的价格。
AWS Service Quotas API：每分钟令牌数（TPM）与每分钟请求数（RPM）配额。
Amazon Bedrock ListInferenceProfiles API：跨区域推理配置与地理范围。
Amazon Bedrock Mantle API：Mantle 推理在各区域的可用性。
LiteLLM 模型数据库（公开 URL）：上下文窗口与最大输出 token。
AWS 文档（公开 URL）：模型生命周期状态（active / legacy / end-of-life）。

其中 TPM 衡量每分钟可处理的 token 数（约 1000 token ≈ 750 词），RPM 则限制 API 调用频次，两者均随模型与区域变化。

流水线架构

整个数据流水线由 AWS Step Functions 编排，包含 17 个 Lambda 函数，按 4 个阶段执行：

阶段 0 初始化：动态发现支持 Bedrock 的 AWS 区域（不硬编码区域列表），初始化 S3 路径与缓存键，并同步前后端配置。
阶段 1 并行采集：三条分支同时运行，分别抓取定价、模型清单与服务配额。
阶段 2 并行增强：在缓存层之上并发执行 6 个增强步骤，完成价格-模型映射、区域可用性、跨区域推理判断、上下文窗口、Mantle 探测与生命周期判定。
阶段 3 聚合发布：合并为两份 JSON——bedrock_models.json（完整模型目录）与 bedrock_pricing.json（按厂商/模型组织的价格），存入 S3 并通过 CloudFront 分发。

流水线每日 UTC 时间 6:00 运行一次，单次执行约 8–12 分钟。通过 Lambda 间 S3 缓存机制，API 调用次数从约 480 次降至 29 次，缓存命中率约 97%。发布前系统会扫描 7 类数据质量问题，超阈值时由基于 Bedrock 的自愈 Agent 分析并自动应用安全修复（原文在此处截断，未给出后续细节）。调度可通过 CloudFormation 模板中的 EventBridge 规则调整。

部署与价值

Model Profiler 以开源形式发布，用户可在自有 AWS 环境中于 5 分钟内完成部署。它适合正在评估新工作负载模型、进行成本与性能优化、或从其他 AI 系统迁移的团队，将原本散落在多份文档与模型卡片中的信息汇聚到统一界面，降低选型与迁移决策的门槛。