Anthropic 指控千问「蒸馏」:一场缺乏证据的叙事战
Anthropic 致信美国政府指控阿里千问蒸馏 Claude 却无实质证据,本文剖析蒸馏技术正当性与中美 AI 叙事权…
- 重要性
- 70
- 新颖性
- 48
- 影响面
- 68
- 可信度
- 65
- 实质性
- 62
Anthropic 对阿里千问的「蒸馏」指控,在缺乏实质证据的情况下迅速发酵,引发全球 AI 社区广泛质疑。这场争议表面上是技术产权之争,实质上更是一场围绕 AI 竞争主导权的叙事战。
蒸馏不是抄袭,而是行业基操
蒸馏(Distillation)由图灵奖得主 Geoffrey Hinton 于 2015 年提出,是 AI 行业公认的合法训练方法。其核心逻辑是让小模型学习大模型的输出风格与任务范式,从而实现能力迁移、提速降本。无论 OpenAI、Anthropic,还是中国的 Qwen、DeepSeek,模型训练流程大同小异,蒸馏早已是行业基操。
AI 专家 Nathan Lambert 指出,蒸馏只是模仿,真正决定模型能力的是强化学习的探索与自我修正。Baseten 模型训练负责人 Charles O'Neill 也表示,单靠知识蒸馏无法构建顶尖 AI 系统,还需要大规模预训练、高质量数据清洗、训练配方、推理优化等一整套底层能力建设。换言之,蒸馏更像「学经验」,能帮模型少走弯路,却不能单独决定模型能走多远。
Anthropic 的双重标准
据路透社、《华尔街日报》报道,Anthropic 致信美国参议员及白宫官员,指控阿里在 4 月至 6 月期间使用约 25000 个虚假账号与 Claude 交互约 2880 万次以蒸馏其模型,但截至目前并未公开任何实质性证据。这一指控与其今年 2 月对 DeepSeek、Kimi、Moonshot 三家中国公司的指控如出一辙。
值得注意的是,Anthropic 自身曾因从盗版网站 LibGen 和 PiLiMi 下载约 48.2 万本注册版权书籍训练模型,被作者集体诉讼,最终以 15 亿美元和解,创下美国版权和解纪录。相比之下,未经证实的蒸馏指控显得缺乏说服力。
更有开发者发现,Claude Opus 4.8 在被以中文询问「你是什么模型」时,曾输出「我是通义千问」或「我是 DeepSeek」等回答,引发社区对 Anthropic 是否同样蒸馏中国模型的讨论。创新工场董事长李开复在 2026 年 3 月的一次采访中亦直言:「蒸馏本身也没有违背什么规则,是不是有点小题大做了呢……Anthropic 还欠我 3000 美元稿费。」
叙事权之争:中国 AI 的结构性挑战
Anthropic 选择此时高调指控,背后有更深层的产业逻辑。OpenRouter 等全球主流 API 平台上,Qwen、GLM、Kimi、DeepSeek 等中国模型长期占据调用榜前列,对 Anthropic 形成实质性竞争压力。
同时,Anthropic 已被美军广泛采用并深度参与政府补助与采购,在安全审查与政府关系方面面临复杂处境。主动强化「中国威胁」叙事,既是其在政策语境中抢占有利位置的手段,也是向华盛顿安全体系递交「可信度」的一种策略——某种程度上,Anthropic 已深度卷入军工复合体,并非象牙塔中的单纯技术公司。
这一叙事模式并非孤例。从宇树机器人被质疑数据回传,到拓竹被指「反开源」,中国前沿科技企业在海外市场频频遭遇技术细节被放大、政治化解读的困境。一面渲染威胁,一面贬低实力,这种自相矛盾的双标已成为普遍现象。
竞争已从性能延伸到定义权
蒸馏争议折射出一个更深层的事实:大模型竞争已不再局限于实验室性能与产品体验,而是扩展到定义权、解释权与合法性层面。围绕训练数据来源、训练方法合规性等技术细节的叙事战,预计将在更多中国 AI 企业身上重演。
长远来看,中国 AI 公司需要在持续提升模型能力的同时,主动参与并争夺全球技术叙事的定义权。当叙事权不在自己手里,哪怕在细分市场已做到全球第一,也依然会争论不断——这是中国企业未来很长一段时间需要共同面对的课题。
