桃子桃子快讯
返回首页
行业动态

Anthropic 解除「寓言禁令」,AI 内容边界之争才刚开始

WSJ 报道 Anthropic 已取消对虚构故事生成的严格限制,围绕 AI 内容治理的更广泛讨论仍在持续。

2026.07.02 · 周四2 分钟阅读

据《华尔街日报》报道,AI 公司 Anthropic 已结束此前对生成虚构故事(即所谓「寓言禁令」)的严格限制。这一政策曾要求模型在用户请求创作小说、寓言等纯虚构内容时给出拒绝或保守回应,引发了关于 AI 应如何在「安全」与「创作自由」之间取得平衡的讨论。报道指出,虽然禁令本身已经解除,但围绕如何驯服 AI 的更大博弈才刚刚开始。

事件背景:从「寓言禁令」到政策松绑

Anthropic 此前对模型的内容边界设有较为严格的规则集,其中一条较为人知的规定是:在用户请求生成完全虚构的叙事(如寓言、童话、短篇小说)时,模型倾向于拒绝或将其改写为现实题材。该规则被部分用户和研究社区称为「寓言禁令」。

《华尔街日报》的报道显示,Anthropic 已调整相关策略,模型不再对纯虚构创作请求一律回避。调整的具体技术细节与生效时间未在标题层面披露,需要进一步查阅正文才能确认。

争议焦点:安全对齐与创作自由

这起事件折射出的是当前生成式 AI 行业普遍面临的一道难题:

  • 过度保守:模型在被训练「拒绝有害内容」时,可能连同无害的虚构创作也一并拒绝,影响用户体验与创作类应用。
  • 管控不足:若完全放开,又可能放大幻觉、虚假信息或被滥用生成有害叙事的风险。
  • 政策透明度:用户往往不清楚模型为何拒绝或允许某一类请求,厂商也面临公开内部准则的压力。

报道标题中的「tame AI」一语,正对应这种在「对齐强度」与「可用性」之间的拉扯。

行业意义与待观察问题

Anthropic 的政策变动并非孤立事件。在过去一段时间里,多家前沿模型厂商都在不同程度上重新审视其内容策略,包括放宽对纯虚构写作、角色扮演、特定题材讨论的限制。

不过,本次报道留下的关键信息仍较有限,例如:

  • 调整仅限虚构故事,还是覆盖更广的内容类别?
  • 是否伴随系统提示、RLHF 训练数据或安全分类器的实质变更?
  • Anthropic 是否对外发布说明文档或博客解释此次改动?

这些细节决定了本次「解禁」究竟是象征性的口径变化,还是产品层面的真实升级。后续值得持续关注厂商的一手声明与社区测试反馈。

信源