Meta 内部禁用 Claude Code 与 Codex，担忧训练数据被「蒸馏」

据 The Information 获取的 Meta 内部备忘录，Meta 应用 AI 工程部门自今年 5 月起被要求暂停部分使用 Claude Code 与 OpenAI Codex 的任务。这份措辞严厉的文件警告，相关做法可能「触发与合作方的严重升级」。值得注意的是，Meta 同时也是 Claude Code 在全球最大的客户之一，今年内部 AI 支出预计高达数十亿美元。一边重金采购，一边限制使用，反常背后指向的是一个更深的担忧：蒸馏。

禁令的来由：自研编程助手 MetaCode

Meta 今年组建了应用 AI 工程团队，主攻自研 AI 编程助手 MetaCode（原名 DevMate），目标是用自家模型替代昂贵的外部工具。但要训练一个能写代码的模型，需要两样东西：高质量训练数据，以及足够难、足够多的编程题与评测体系。

问题在于，若这些题目、答案甚至判分标准出自 Claude 或 Codex，MetaCode 学到的不再是「人类工程师的本事」，而是「对手模型的本事」。更隐蔽的是评测环节——若用 Codex 给模型判分，MetaCode 就会朝着「Codex 觉得对」的方向进化，将对手的判断标准复刻进自己脑中。

这就是 Meta 这份指南要堵的口子：不让 AI 当出题人、判卷人，连「AI 生成的材料能不能进被测模型可访问的环境」都要管。

三条具体限制

Meta 内部文件明确规定了三类禁止事项：

不得用 Claude 或 Codex 的输出去给自家模型出测试题，原话是「明确属于工程师不在驾驶位的范畴」、「我们不要源自模型的任务」；
不得让 AI 在源码里找 bug，也不得让它基于代码分析建议「该测什么」；
AI 生成的任何内容，都不能放进被测模型能够访问到的地方。

文件同时列出了仍可使用 AI 的场景：搭建工作流、整理代码与文件、为内部工具搭建测试脚手架等日常杂活。但即便如此，每一行 AI 产出都需人工过审。

Meta 发言人回应称，公司有「明确的政策」规范 AI 工具使用，内部文件中并无员工违规记录。

行业命门：蒸馏陷阱

Meta 担忧的核心，是业内所说的「蒸馏」（distillation）——拿更强模型的输出训练较弱模型。蒸馏本身是业界常规做法，大厂也常用大模型蒸馏出更小的版本。但麻烦在于：若你抄的是别人家的模型，训出来的能力到底是自己练的还是顺来的，根本说不清。

美国法律并未明文禁止蒸馏，AI 生成内容也不受版权保护。唯一的关卡是合同——OpenAI 与 Anthropic 的服务条款均明确禁止用模型输出「造一个跟自己竞争的东西」，而执法权全握在竞争对手手中。去年 Anthropic 直接切断了 OpenAI 对 Claude 的 API 访问；今年 4 月，马斯克也在庭审中被迫承认 xAI「部分」蒸馏过 OpenAI 模型。

对 Meta 而言，还有一个更现实的考量：省钱。按内部备忘录，Meta 今年内部 AI 支出正奔着数十亿美元去，公司已开始为员工设置 token 用量上限。把开发工作从昂贵外部工具迁到自家 MetaCode 上，既能省成本，又能规避蒸馏风险。

走钢丝的不只 Meta

科技法学者 Mark Leiser 形容 Meta 的内部文件「几乎就是一张走钢丝的地图」：一边要获得外部模型的能力，一边要防止其「本事」渗入自家系统。这道难题并非 Meta 独有，而是整个行业的结构性矛盾——当你用足够聪明的 AI 去造另一个同样聪明的 AI，到最后，「这份聪明究竟是你自己练出来的，还是从别人那里悄悄学来的」，将越来越难回答。

而对普通开发者而言，这件事也并不遥远：你用 AI 写的代码、攒的资料，本身就可能成为下一代模型的养料。AI 帮我们造 AI 的循环一旦闭合，「本事到底是谁的」这条界线，正在变得越来越模糊。