美团LongCat-2.0:1.6万亿参数全栈国产训练,但权重与数据仍未公开
美团LongCat-2.0采用1.6万亿参数MoE架构,在五万卡国产ASIC集群上完成训练,SWE-bench Pro得…
美团近期在 Hugging Face 上线了 LongCat-2.0 模型页面,宣称基于 MIT 协议开源、采用 1.6 万亿参数的 MoE 架构,并在一套五万卡规模的国产 AI 加速芯片集群上完成端到端训练。这一进展被视为国产算力生态首次完成超大规模模型的训练验证,但围绕权重开放程度、训练数据披露与基准成绩可比性,行业仍有不少疑问。
模型规格与训练底座
LongCat-2.0 的核心参数如下:
- 总参数量 1.6 万亿,每次推理平均激活约 480 亿参数
- 原生支持 100 万 token 超长上下文
- 采用稀疏注意力、多专家动态融合等优化
- 训练硬件为五万卡规模的国产 ASIC 集群,使用自研分布式通信协议替代 NVIDIA NCCL
按官方表述,这是国产算力生态中首次在如此规模上完成端到端训练验证,强调从底层芯片到上层框架的「全栈国产」路径。
基准表现与定价策略
LongCat-2.0 在 SWE-bench Pro 上拿到 59.5 分,略高于文中所提及 GPT-5.5 的 58.6 分。在 OpenRouter 平台上,该模型曾以 Owl Alpha 的匿名身份上线数月,月调用量一度挤进全球前三。这一成绩主要来自较低的 API 定价(约 0.30 美元 / 百万 token,远低于 GPT-5.5 的 2.50 美元)以及大量免费额度。OpenRouter 上线初期冲榜本身是新模型常见的推广路径,付费用户占比有限。
争议:权重未释、数据未披
尽管页面标注 MIT License,模型权重状态仍为「coming soon」,仅开放了推理框架与 Infra 代码。训练数据的构成、清洗规则、超过 35T tokens 的训练语料均未披露。行业对「大模型开源」的默认共识通常包括:开放权重、训练代码、数据配比与流程,以便第三方复现或微调。从当前披露程度看,LongCat-2.0 更接近「免费商用的闭源模型」。
文中还指出三个关键数字仍未公开:
- 国产芯片的具体厂商
- 训练总成本
- 实际训练耗时(wall-clock time)
这些信息的缺失,使得全国产路径的真实效率与经济性难以被外部验证。
定位:垂直模型而非通用对手
LongCat-2.0 在训练目标和数据底座上明显偏向本地生活场景——商家智能助手、外卖调度、到店运营等。其通用问答与多模态能力相对同期竞品偏弱,性能对标的是 Claude Opus 4.6,但 Anthropic 同期已迭代至 4.8,时间窗口并不宽裕。在宣传层面容易与「通用大模型突破」混淆,但本质上是一次面向美团自身业务的工程交付。
与同期国产模型的路线分化
进入下半年,多家国产厂商集中发布大模型,路线明显分化:
- 月之暗面 Kimi K3:2.5 万亿参数,通用多模态路线,对标 OpenAI、Anthropic
- 百度文心 5.0:2.4 万亿参数,原生全模态
- DeepSeek V4:万亿级参数,主打开源与极低 API 成本
- 美团 LongCat-2.0:1.6 万亿参数,本地生活垂直,押注全栈国产
参数规模持续攀升,但中小厂商真正需要的是能够压缩客服成本、部署成本可控的轻量化方案。五万卡集群按行业通用估算三年综合成本接近百亿级别,这一路径依赖稳定的本地生活现金流做摊薄,纯 AI 创业公司难以复制。
小结
LongCat-2.0 在工程层面展示了国产万卡 ASIC 集群完成万亿级 MoE 端到端训练的可行性,对国产算力生态是一次有意义的验证。但在权重尚未发布、训练数据构成未披露、关键成本数字未公开之前,外界难以对其真实成色做出完整评估。真正的「公共基础设施」交付,至少需要芯片与集群配置可核验、权重可下载、训练数据可追溯——在此之前,掌声不妨先等一等。
