NVIDIA Nemotron 与 OpenAI GPT OSS 登陆 AWS GovCloud

Amazon Bedrock 近日在 AWS GovCloud (US) 区域上线了 NVIDIA Nemotron 与 OpenAI 开源权重 GPT OSS 两套模型家族，面向美国政府机构、国防与情报社区及其供应商。借助这一更新，相关客户可以在满足 FedRAMP High、DoD SRG Impact Level 2/4/5、ITAR、CJIS 等合规框架要求的前提下，使用前沿开源权重模型来构建生成式 AI 应用，覆盖情报分析、任务规划、合同审阅、安全日志分析、合规自动化等场景，且敏感数据无需离开 AWS GovCloud 的隔离边界。

上线的模型家族

本次发布涉及两家厂商的两类开源权重模型，Amazon Bedrock 通过统一 API 提供推理服务：

NVIDIA Nemotron 3 系列：包含 Super 120B 以及 Nano 系列（含 Nano 9B v2、Nano 12B v2、Nano 30B），定位为兼顾计算效率与精度的 SLM/LLM 模型族，适合专用的智能体系统。
OpenAI GPT OSS 系列：包含 gpt-oss-120b 与 gpt-oss-20b 两个变体，均为文本到文本的开放权重模型，强调推理、智能体与开发者任务，并支持可调的推理强度与外部工具集成。

Nemotron 系列技术亮点

NVIDIA 将 Nemotron 3 定位为面向复杂多智能体工作负载的高效模型，关键能力包括：

Nemotron 3 Super（120B）：总参数量 120B 的开放混合 MoE 模型，每个 token 仅激活约 12B 参数。官方称其推理吞吐量较前代最高提升 5 倍，并支持 100 万 token 上下文窗口，为长链路、多步骤的智能体任务提供长期记忆。
Nemotron 3 Nano（30B）：总参数量 30B，每 token 激活约 3B 参数。官方称其推理吞吐量较前代提升 4 倍，推理 token 生成量最高减少 60%，同样具备 100 万 token 上下文窗口，适合长时间运行的多步骤智能体流程。

OpenAI GPT OSS 能力与定位

gpt-oss-120b 是 120B 参数的开源权重模型，面向生产级通用与高强度推理场景；gpt-oss-20b 是 20B 参数版本，主打低延迟、本地化或专业化部署。两者均提供 128K token 上下文窗口与最高 16K token 输出，仅支持文本输入与输出。

由于权重开放，客户可以独立审查模型架构、查阅发布的模型卡（model card），并对代表性工作负载自行运行基准测试。对政府团队而言，这种透明度有助于在部署前由安全团队完成模型行为评估，契合零信任原则。

在合规边界内运行的无服务器推理

AWS GovCloud (US) 是一组用于托管敏感数据与受监管工作负载的独立 AWS 区域，物理位置位于美国境内，由美国公民运维。Amazon Bedrock 作为全托管基础模型服务，其推理运行在 AWS 自有基础设施之上，本次上线后，Nemotron 与 GPT OSS 模型的推理同样在 AWS GovCloud 的隔离边界内完成，数据不会离开该合规边界。客户可以结合自身的数据驻留与合规需求选择对应区域与服务层级，并在不改动应用代码的前提下，通过统一 API 在不同模型之间切换以适配具体用例。