桃子桃子快讯
返回首页
产品功能

NVIDIA Nemotron 与 OpenAI GPT OSS 登陆 AWS GovCloud

Amazon Bedrock 在 AWS GovCloud 上线 NVIDIA Nemotron 与 OpenAI GP…

2026.07.02 · 周四4 分钟阅读

Amazon Bedrock 近日在 AWS GovCloud (US) 区域上线了 NVIDIA Nemotron 与 OpenAI 开源权重 GPT OSS 两套模型家族,面向美国政府机构、国防与情报社区及其供应商。借助这一更新,相关客户可以在满足 FedRAMP High、DoD SRG Impact Level 2/4/5、ITAR、CJIS 等合规框架要求的前提下,使用前沿开源权重模型来构建生成式 AI 应用,覆盖情报分析、任务规划、合同审阅、安全日志分析、合规自动化等场景,且敏感数据无需离开 AWS GovCloud 的隔离边界。

上线的模型家族

本次发布涉及两家厂商的两类开源权重模型,Amazon Bedrock 通过统一 API 提供推理服务:

  • NVIDIA Nemotron 3 系列:包含 Super 120B 以及 Nano 系列(含 Nano 9B v2、Nano 12B v2、Nano 30B),定位为兼顾计算效率与精度的 SLM/LLM 模型族,适合专用的智能体系统。
  • OpenAI GPT OSS 系列:包含 gpt-oss-120b 与 gpt-oss-20b 两个变体,均为文本到文本的开放权重模型,强调推理、智能体与开发者任务,并支持可调的推理强度与外部工具集成。

Nemotron 系列技术亮点

NVIDIA 将 Nemotron 3 定位为面向复杂多智能体工作负载的高效模型,关键能力包括:

  • Nemotron 3 Super(120B):总参数量 120B 的开放混合 MoE 模型,每个 token 仅激活约 12B 参数。官方称其推理吞吐量较前代最高提升 5 倍,并支持 100 万 token 上下文窗口,为长链路、多步骤的智能体任务提供长期记忆。
  • Nemotron 3 Nano(30B):总参数量 30B,每 token 激活约 3B 参数。官方称其推理吞吐量较前代提升 4 倍,推理 token 生成量最高减少 60%,同样具备 100 万 token 上下文窗口,适合长时间运行的多步骤智能体流程。

OpenAI GPT OSS 能力与定位

gpt-oss-120b 是 120B 参数的开源权重模型,面向生产级通用与高强度推理场景;gpt-oss-20b 是 20B 参数版本,主打低延迟、本地化或专业化部署。两者均提供 128K token 上下文窗口与最高 16K token 输出,仅支持文本输入与输出。

由于权重开放,客户可以独立审查模型架构、查阅发布的模型卡(model card),并对代表性工作负载自行运行基准测试。对政府团队而言,这种透明度有助于在部署前由安全团队完成模型行为评估,契合零信任原则。

在合规边界内运行的无服务器推理

AWS GovCloud (US) 是一组用于托管敏感数据与受监管工作负载的独立 AWS 区域,物理位置位于美国境内,由美国公民运维。Amazon Bedrock 作为全托管基础模型服务,其推理运行在 AWS 自有基础设施之上,本次上线后,Nemotron 与 GPT OSS 模型的推理同样在 AWS GovCloud 的隔离边界内完成,数据不会离开该合规边界。客户可以结合自身的数据驻留与合规需求选择对应区域与服务层级,并在不改动应用代码的前提下,通过统一 API 在不同模型之间切换以适配具体用例。

信源