开源
华为开源盘古 2.0 Flash:92B 总参 / 6B 激活,支持 512K 上下文
华为宣布开源 OpenPangu-2.0-Flash,总参 92B、激活 6B、上下文 512K,同系列 Pro 版 5…
2026.06.30 · 周二约 2 分钟阅读评分 71
评分细项加权总分 71
- 重要性
- 72
- 新颖性
- 78
- 影响面
- 70
- 可信度
- 62
- 实质性
- 58
华为正式开源了其大模型系列 OpenPangu 2.0 中的轻量级版本 OpenPangu-2.0-Flash。该模型总参数 920 亿,单 token 激活参数仅 60 亿,并原生支持 512K 长上下文,是近期国内厂商发布的较大规模 MoE 架构开源模型之一。本次开源同步释出模型权重、推理代码与训练算子(operators),方便研究者与开发者复现和二次开发。
模型规格与架构
OpenPangu-2.0-Flash 采用典型的混合专家(MoE)架构设计,在总参数量大幅扩张的同时,把单次推理的计算开销控制在较小规模:
- 总参数:92B
- 单 token 激活参数:6B
- 上下文长度:512K
- 开源内容:模型权重、推理代码、训练算子
这一组合意味着模型在理论上具备较强的长文本处理能力,同时对显存与算力的需求低于同参数量级的稠密模型,对部署成本较为友好。
同系列旗舰版本即将发布
华为透露,OpenPangu 2.0 系列还包含更大体量的 Pro 版本,预计将在 7 月推出:
- 总参数:505B
- 单 token 激活参数:18B
- 定位:OpenPangu 2.0 系列旗舰
Pro 版本的具体开源时间、是否同步开源权重与代码等细节,目前尚未明确披露,华为表示后续还将公布更多开源组件。
行业意义与待观察点
从行业角度看,盘古 2.0 Flash 的开源进一步丰富了中文语境下的可选大模型生态,尤其是在 512K 长上下文与 MoE 架构交叉的细分区间,给开发者提供了一个新的基线选项。60B 量级以下的激活参数,也使其在多卡消费级或企业级 GPU 上的本地化部署具备一定可行性。
不过,截至目前公开信息中尚未给出系统的 benchmark 成绩、训练数据规模、许可证类型以及与 Qwen、DeepSeek、Llama 等同类模型的横向对比数据,这些信息将直接影响该模型在开源社区的实际采用度,值得后续关注。
