桃子桃子 AI 快讯
返回首页
开源

华为开源盘古 2.0 Flash:92B 总参 / 6B 激活,支持 512K 上下文

华为宣布开源 OpenPangu-2.0-Flash,总参 92B、激活 6B、上下文 512K,同系列 Pro 版 5…

2026.06.30 · 周二2 分钟阅读评分 71
评分细项加权总分 71
重要性
72
新颖性
78
影响面
70
可信度
62
实质性
58

华为正式开源了其大模型系列 OpenPangu 2.0 中的轻量级版本 OpenPangu-2.0-Flash。该模型总参数 920 亿,单 token 激活参数仅 60 亿,并原生支持 512K 长上下文,是近期国内厂商发布的较大规模 MoE 架构开源模型之一。本次开源同步释出模型权重、推理代码与训练算子(operators),方便研究者与开发者复现和二次开发。

模型规格与架构

OpenPangu-2.0-Flash 采用典型的混合专家(MoE)架构设计,在总参数量大幅扩张的同时,把单次推理的计算开销控制在较小规模:

  • 总参数:92B
  • 单 token 激活参数:6B
  • 上下文长度:512K
  • 开源内容:模型权重、推理代码、训练算子

这一组合意味着模型在理论上具备较强的长文本处理能力,同时对显存与算力的需求低于同参数量级的稠密模型,对部署成本较为友好。

同系列旗舰版本即将发布

华为透露,OpenPangu 2.0 系列还包含更大体量的 Pro 版本,预计将在 7 月推出:

  • 总参数:505B
  • 单 token 激活参数:18B
  • 定位:OpenPangu 2.0 系列旗舰

Pro 版本的具体开源时间、是否同步开源权重与代码等细节,目前尚未明确披露,华为表示后续还将公布更多开源组件。

行业意义与待观察点

从行业角度看,盘古 2.0 Flash 的开源进一步丰富了中文语境下的可选大模型生态,尤其是在 512K 长上下文与 MoE 架构交叉的细分区间,给开发者提供了一个新的基线选项。60B 量级以下的激活参数,也使其在多卡消费级或企业级 GPU 上的本地化部署具备一定可行性。

不过,截至目前公开信息中尚未给出系统的 benchmark 成绩、训练数据规模、许可证类型以及与 Qwen、DeepSeek、Llama 等同类模型的横向对比数据,这些信息将直接影响该模型在开源社区的实际采用度,值得后续关注。

信源