行业动态
Anthropic 解除「寓言禁令」,AI 内容边界之争才刚开始
WSJ 报道 Anthropic 已取消对虚构故事生成的严格限制,围绕 AI 内容治理的更广泛讨论仍在持续。
2026.07.02 · 周四约 2 分钟阅读
据《华尔街日报》报道,AI 公司 Anthropic 已结束此前对生成虚构故事(即所谓「寓言禁令」)的严格限制。这一政策曾要求模型在用户请求创作小说、寓言等纯虚构内容时给出拒绝或保守回应,引发了关于 AI 应如何在「安全」与「创作自由」之间取得平衡的讨论。报道指出,虽然禁令本身已经解除,但围绕如何驯服 AI 的更大博弈才刚刚开始。
事件背景:从「寓言禁令」到政策松绑
Anthropic 此前对模型的内容边界设有较为严格的规则集,其中一条较为人知的规定是:在用户请求生成完全虚构的叙事(如寓言、童话、短篇小说)时,模型倾向于拒绝或将其改写为现实题材。该规则被部分用户和研究社区称为「寓言禁令」。
《华尔街日报》的报道显示,Anthropic 已调整相关策略,模型不再对纯虚构创作请求一律回避。调整的具体技术细节与生效时间未在标题层面披露,需要进一步查阅正文才能确认。
争议焦点:安全对齐与创作自由
这起事件折射出的是当前生成式 AI 行业普遍面临的一道难题:
- 过度保守:模型在被训练「拒绝有害内容」时,可能连同无害的虚构创作也一并拒绝,影响用户体验与创作类应用。
- 管控不足:若完全放开,又可能放大幻觉、虚假信息或被滥用生成有害叙事的风险。
- 政策透明度:用户往往不清楚模型为何拒绝或允许某一类请求,厂商也面临公开内部准则的压力。
报道标题中的「tame AI」一语,正对应这种在「对齐强度」与「可用性」之间的拉扯。
行业意义与待观察问题
Anthropic 的政策变动并非孤立事件。在过去一段时间里,多家前沿模型厂商都在不同程度上重新审视其内容策略,包括放宽对纯虚构写作、角色扮演、特定题材讨论的限制。
不过,本次报道留下的关键信息仍较有限,例如:
- 调整仅限虚构故事,还是覆盖更广的内容类别?
- 是否伴随系统提示、RLHF 训练数据或安全分类器的实质变更?
- Anthropic 是否对外发布说明文档或博客解释此次改动?
这些细节决定了本次「解禁」究竟是象征性的口径变化,还是产品层面的真实升级。后续值得持续关注厂商的一手声明与社区测试反馈。
