华为开源盘古 2.0 Flash：92B 总参 / 6B 激活，支持 512K 上下文

华为正式开源了其大模型系列 OpenPangu 2.0 中的轻量级版本 OpenPangu-2.0-Flash。该模型总参数 920 亿，单 token 激活参数仅 60 亿，并原生支持 512K 长上下文，是近期国内厂商发布的较大规模 MoE 架构开源模型之一。本次开源同步释出模型权重、推理代码与训练算子（operators），方便研究者与开发者复现和二次开发。

模型规格与架构

OpenPangu-2.0-Flash 采用典型的混合专家（MoE）架构设计，在总参数量大幅扩张的同时，把单次推理的计算开销控制在较小规模：

总参数：92B
单 token 激活参数：6B
上下文长度：512K
开源内容：模型权重、推理代码、训练算子

这一组合意味着模型在理论上具备较强的长文本处理能力，同时对显存与算力的需求低于同参数量级的稠密模型，对部署成本较为友好。

同系列旗舰版本即将发布

华为透露，OpenPangu 2.0 系列还包含更大体量的 Pro 版本，预计将在 7 月推出：

总参数：505B
单 token 激活参数：18B
定位：OpenPangu 2.0 系列旗舰

Pro 版本的具体开源时间、是否同步开源权重与代码等细节，目前尚未明确披露，华为表示后续还将公布更多开源组件。

行业意义与待观察点

从行业角度看，盘古 2.0 Flash 的开源进一步丰富了中文语境下的可选大模型生态，尤其是在 512K 长上下文与 MoE 架构交叉的细分区间，给开发者提供了一个新的基线选项。60B 量级以下的激活参数，也使其在多卡消费级或企业级 GPU 上的本地化部署具备一定可行性。

不过，截至目前公开信息中尚未给出系统的 benchmark 成绩、训练数据规模、许可证类型以及与 Qwen、DeepSeek、Llama 等同类模型的横向对比数据，这些信息将直接影响该模型在开源社区的实际采用度，值得后续关注。