桃子桃子 AI 快讯
返回首页
行业动态

Meta 内部禁用 Claude Code 与 Codex,担忧训练数据被「蒸馏」

Meta 限制应用 AI 团队使用 Claude Code 与 Codex,以防对手模型输出污染自研编程助手 MetaC…

2026.06.30 · 周二4 分钟阅读评分 73
评分细项加权总分 73
重要性
72
新颖性
78
影响面
68
可信度
78
实质性
72

据 The Information 获取的 Meta 内部备忘录,Meta 应用 AI 工程部门自今年 5 月起被要求暂停部分使用 Claude Code 与 OpenAI Codex 的任务。这份措辞严厉的文件警告,相关做法可能「触发与合作方的严重升级」。值得注意的是,Meta 同时也是 Claude Code 在全球最大的客户之一,今年内部 AI 支出预计高达数十亿美元。一边重金采购,一边限制使用,反常背后指向的是一个更深的担忧:蒸馏。

禁令的来由:自研编程助手 MetaCode

Meta 今年组建了应用 AI 工程团队,主攻自研 AI 编程助手 MetaCode(原名 DevMate),目标是用自家模型替代昂贵的外部工具。但要训练一个能写代码的模型,需要两样东西:高质量训练数据,以及足够难、足够多的编程题与评测体系。

问题在于,若这些题目、答案甚至判分标准出自 Claude 或 Codex,MetaCode 学到的不再是「人类工程师的本事」,而是「对手模型的本事」。更隐蔽的是评测环节——若用 Codex 给模型判分,MetaCode 就会朝着「Codex 觉得对」的方向进化,将对手的判断标准复刻进自己脑中。

这就是 Meta 这份指南要堵的口子:不让 AI 当出题人、判卷人,连「AI 生成的材料能不能进被测模型可访问的环境」都要管。

三条具体限制

Meta 内部文件明确规定了三类禁止事项:

  • 不得用 Claude 或 Codex 的输出去给自家模型出测试题,原话是「明确属于工程师不在驾驶位的范畴」、「我们不要源自模型的任务」;
  • 不得让 AI 在源码里找 bug,也不得让它基于代码分析建议「该测什么」;
  • AI 生成的任何内容,都不能放进被测模型能够访问到的地方。

文件同时列出了仍可使用 AI 的场景:搭建工作流、整理代码与文件、为内部工具搭建测试脚手架等日常杂活。但即便如此,每一行 AI 产出都需人工过审。

Meta 发言人回应称,公司有「明确的政策」规范 AI 工具使用,内部文件中并无员工违规记录。

行业命门:蒸馏陷阱

Meta 担忧的核心,是业内所说的「蒸馏」(distillation)——拿更强模型的输出训练较弱模型。蒸馏本身是业界常规做法,大厂也常用大模型蒸馏出更小的版本。但麻烦在于:若你抄的是别人家的模型,训出来的能力到底是自己练的还是顺来的,根本说不清。

美国法律并未明文禁止蒸馏,AI 生成内容也不受版权保护。唯一的关卡是合同——OpenAI 与 Anthropic 的服务条款均明确禁止用模型输出「造一个跟自己竞争的东西」,而执法权全握在竞争对手手中。去年 Anthropic 直接切断了 OpenAI 对 Claude 的 API 访问;今年 4 月,马斯克也在庭审中被迫承认 xAI「部分」蒸馏过 OpenAI 模型。

对 Meta 而言,还有一个更现实的考量:省钱。按内部备忘录,Meta 今年内部 AI 支出正奔着数十亿美元去,公司已开始为员工设置 token 用量上限。把开发工作从昂贵外部工具迁到自家 MetaCode 上,既能省成本,又能规避蒸馏风险。

走钢丝的不只 Meta

科技法学者 Mark Leiser 形容 Meta 的内部文件「几乎就是一张走钢丝的地图」:一边要获得外部模型的能力,一边要防止其「本事」渗入自家系统。这道难题并非 Meta 独有,而是整个行业的结构性矛盾——当你用足够聪明的 AI 去造另一个同样聪明的 AI,到最后,「这份聪明究竟是你自己练出来的,还是从别人那里悄悄学来的」,将越来越难回答。

而对普通开发者而言,这件事也并不遥远:你用 AI 写的代码、攒的资料,本身就可能成为下一代模型的养料。AI 帮我们造 AI 的循环一旦闭合,「本事到底是谁的」这条界线,正在变得越来越模糊。

信源