Anthropic 重新部署 Fable 5，用量与安全双双收紧

Anthropic 于 7 月 1 日重新部署其前沿模型 Fable 5，但此次上线伴随着由美国商务部主导的出口管制限制，多项使用条款较此前明显收紧，分析认为此举释放出 AI 监管走向的新信号。

上线安排与用量限制

Fable 5 自 7 月 1 日起在全球范围内的 Claude Platform、Claude.ai、Claude Code 及 Claude Cowork 平台上线。Pro、Max、Team 以及部分 Enterprise 套餐的用户，可在 7 月 7 日前将 Fable 5 计入每周用量上限的最多 50%；7 月 7 日之后则改用按量计费的信用额度体系。

与出口管制之前的版本相比，本次有两条关键变化：

付费订阅内含的 Fable 使用周期由两周缩短为一周；
可用于 Fable 的 token 比例由 100% 降至 50%。

更高级的 Mythos 版本仍未同步上线。评论认为，50% 这一比例的设置并非出于「形象」考虑，更可能反映了算力供给的现实约束。

触发限制的导火索

6 月 12 日下达的出口管制指令，源于一份亚马逊研究人员的报告：该报告发现了一种绕过 Fable 5 安全防护的方法，通过特定提示使模型识别出多个软件漏洞。Anthropic 在博文中承认，能力较弱的模型（包括 Claude Opus 4.8、GPT-5.5、Kimi K2.7 等）同样能够识别这些漏洞——也就是说，被作为「卡点」的越狱手段并非 Fable 5 所独有，而是行业前沿模型普遍存在的低优先级风险。

Anthropic 在博文中强调，越狱行为本身「对该模型相对其他模型的更广泛能力并无影响」，并呼吁行业建立统一的越狱评估与修复机制，矛头暗指未受政府直接监管的开源模型阵营。

更激进的安全分类器

Anthropic 表示已与美国政府合作训练了新版安全分类器，专门用于拦截上述报告中描述的行为。当请求被拦截时，系统会通知用户，并将请求转交给 Opus 4.8 处理，不存在静默重路由。

但新版分类器带来明显副作用：

在常规编码与调试任务中，更多正常请求被误判为可疑并被拦截；
Anthropic 引入了比以往任何版本都更宽的「安全余量」，要求请求「看起来明显安全」才会放行；
部分本可完成的合法任务被以「宁滥勿缺」为理由屏蔽。

Anthropic 承认这是在「广泛可用模型其他能力与误报率之间的权衡」。评论人士指出，这种取舍可能让前沿模型的实际能力上限被压低到 Opus 4.8 / GPT-5.5 这一层级——更强大的模型仍可能因分类器过严而无法发挥完整能力，依赖复杂编程和实验性提示的研究者将首先感受到这一变化。

行业意义

此次事件是 AI 前沿模型首次因具体越狱报告被纳入出口管制。从 Anthropic 的措辞看，未来类似的安全「余量」可能成为常态；对于身处能力前沿的研究者与开发者而言，前沿模型的可用能力边界事实上正在被外部力量压缩。Anthropic 在博文中承诺会持续优化分类器，但短期内，模型在敏感任务上的可靠性与创造力的天平，已明显向后者倾斜。