桃子桃子快讯
返回首页
行业动态

Anthropic 重新部署 Fable 5,用量与安全双双收紧

7 月 1 日 Fable 5 在出口管制后恢复上线,付费用户每周用量上限降至 50%,新版安全分类器误报率上升。

2026.07.02 · 周四3 分钟阅读

Anthropic 于 7 月 1 日重新部署其前沿模型 Fable 5,但此次上线伴随着由美国商务部主导的出口管制限制,多项使用条款较此前明显收紧,分析认为此举释放出 AI 监管走向的新信号。

上线安排与用量限制

Fable 5 自 7 月 1 日起在全球范围内的 Claude Platform、Claude.ai、Claude Code 及 Claude Cowork 平台上线。Pro、Max、Team 以及部分 Enterprise 套餐的用户,可在 7 月 7 日前将 Fable 5 计入每周用量上限的最多 50%;7 月 7 日之后则改用按量计费的信用额度体系。

与出口管制之前的版本相比,本次有两条关键变化:

  • 付费订阅内含的 Fable 使用周期由两周缩短为一周;
  • 可用于 Fable 的 token 比例由 100% 降至 50%。

更高级的 Mythos 版本仍未同步上线。评论认为,50% 这一比例的设置并非出于「形象」考虑,更可能反映了算力供给的现实约束。

触发限制的导火索

6 月 12 日下达的出口管制指令,源于一份亚马逊研究人员的报告:该报告发现了一种绕过 Fable 5 安全防护的方法,通过特定提示使模型识别出多个软件漏洞。Anthropic 在博文中承认,能力较弱的模型(包括 Claude Opus 4.8、GPT-5.5、Kimi K2.7 等)同样能够识别这些漏洞——也就是说,被作为「卡点」的越狱手段并非 Fable 5 所独有,而是行业前沿模型普遍存在的低优先级风险。

Anthropic 在博文中强调,越狱行为本身「对该模型相对其他模型的更广泛能力并无影响」,并呼吁行业建立统一的越狱评估与修复机制,矛头暗指未受政府直接监管的开源模型阵营。

更激进的安全分类器

Anthropic 表示已与美国政府合作训练了新版安全分类器,专门用于拦截上述报告中描述的行为。当请求被拦截时,系统会通知用户,并将请求转交给 Opus 4.8 处理,不存在静默重路由。

但新版分类器带来明显副作用:

  • 在常规编码与调试任务中,更多正常请求被误判为可疑并被拦截;
  • Anthropic 引入了比以往任何版本都更宽的「安全余量」,要求请求「看起来明显安全」才会放行;
  • 部分本可完成的合法任务被以「宁滥勿缺」为理由屏蔽。

Anthropic 承认这是在「广泛可用模型其他能力与误报率之间的权衡」。评论人士指出,这种取舍可能让前沿模型的实际能力上限被压低到 Opus 4.8 / GPT-5.5 这一层级——更强大的模型仍可能因分类器过严而无法发挥完整能力,依赖复杂编程和实验性提示的研究者将首先感受到这一变化。

行业意义

此次事件是 AI 前沿模型首次因具体越狱报告被纳入出口管制。从 Anthropic 的措辞看,未来类似的安全「余量」可能成为常态;对于身处能力前沿的研究者与开发者而言,前沿模型的可用能力边界事实上正在被外部力量压缩。Anthropic 在博文中承诺会持续优化分类器,但短期内,模型在敏感任务上的可靠性与创造力的天平,已明显向后者倾斜。

信源