美团LongCat-2.0：1.6万亿参数全栈国产训练，但权重与数据仍未公开

美团近期在 Hugging Face 上线了 LongCat-2.0 模型页面，宣称基于 MIT 协议开源、采用 1.6 万亿参数的 MoE 架构，并在一套五万卡规模的国产 AI 加速芯片集群上完成端到端训练。这一进展被视为国产算力生态首次完成超大规模模型的训练验证，但围绕权重开放程度、训练数据披露与基准成绩可比性，行业仍有不少疑问。

模型规格与训练底座

LongCat-2.0 的核心参数如下：

总参数量 1.6 万亿，每次推理平均激活约 480 亿参数
原生支持 100 万 token 超长上下文
采用稀疏注意力、多专家动态融合等优化
训练硬件为五万卡规模的国产 ASIC 集群，使用自研分布式通信协议替代 NVIDIA NCCL

按官方表述，这是国产算力生态中首次在如此规模上完成端到端训练验证，强调从底层芯片到上层框架的「全栈国产」路径。

基准表现与定价策略

LongCat-2.0 在 SWE-bench Pro 上拿到 59.5 分，略高于文中所提及 GPT-5.5 的 58.6 分。在 OpenRouter 平台上，该模型曾以 Owl Alpha 的匿名身份上线数月，月调用量一度挤进全球前三。这一成绩主要来自较低的 API 定价（约 0.30 美元 / 百万 token，远低于 GPT-5.5 的 2.50 美元）以及大量免费额度。OpenRouter 上线初期冲榜本身是新模型常见的推广路径，付费用户占比有限。

争议：权重未释、数据未披

尽管页面标注 MIT License，模型权重状态仍为「coming soon」，仅开放了推理框架与 Infra 代码。训练数据的构成、清洗规则、超过 35T tokens 的训练语料均未披露。行业对「大模型开源」的默认共识通常包括：开放权重、训练代码、数据配比与流程，以便第三方复现或微调。从当前披露程度看，LongCat-2.0 更接近「免费商用的闭源模型」。

文中还指出三个关键数字仍未公开：

国产芯片的具体厂商
训练总成本
实际训练耗时（wall-clock time）

这些信息的缺失，使得全国产路径的真实效率与经济性难以被外部验证。

定位：垂直模型而非通用对手

LongCat-2.0 在训练目标和数据底座上明显偏向本地生活场景——商家智能助手、外卖调度、到店运营等。其通用问答与多模态能力相对同期竞品偏弱，性能对标的是 Claude Opus 4.6，但 Anthropic 同期已迭代至 4.8，时间窗口并不宽裕。在宣传层面容易与「通用大模型突破」混淆，但本质上是一次面向美团自身业务的工程交付。

与同期国产模型的路线分化

进入下半年，多家国产厂商集中发布大模型，路线明显分化：

月之暗面 Kimi K3：2.5 万亿参数，通用多模态路线，对标 OpenAI、Anthropic
百度文心 5.0：2.4 万亿参数，原生全模态
DeepSeek V4：万亿级参数，主打开源与极低 API 成本
美团 LongCat-2.0：1.6 万亿参数，本地生活垂直，押注全栈国产

参数规模持续攀升，但中小厂商真正需要的是能够压缩客服成本、部署成本可控的轻量化方案。五万卡集群按行业通用估算三年综合成本接近百亿级别，这一路径依赖稳定的本地生活现金流做摊薄，纯 AI 创业公司难以复制。

小结

LongCat-2.0 在工程层面展示了国产万卡 ASIC 集群完成万亿级 MoE 端到端训练的可行性，对国产算力生态是一次有意义的验证。但在权重尚未发布、训练数据构成未披露、关键成本数字未公开之前，外界难以对其真实成色做出完整评估。真正的「公共基础设施」交付，至少需要芯片与集群配置可核验、权重可下载、训练数据可追溯——在此之前，掌声不妨先等一等。