Anthropic 解除「寓言禁令」，AI 内容边界之争才刚开始

据《华尔街日报》报道，AI 公司 Anthropic 已结束此前对生成虚构故事（即所谓「寓言禁令」）的严格限制。这一政策曾要求模型在用户请求创作小说、寓言等纯虚构内容时给出拒绝或保守回应，引发了关于 AI 应如何在「安全」与「创作自由」之间取得平衡的讨论。报道指出，虽然禁令本身已经解除，但围绕如何驯服 AI 的更大博弈才刚刚开始。

事件背景：从「寓言禁令」到政策松绑

Anthropic 此前对模型的内容边界设有较为严格的规则集，其中一条较为人知的规定是：在用户请求生成完全虚构的叙事（如寓言、童话、短篇小说）时，模型倾向于拒绝或将其改写为现实题材。该规则被部分用户和研究社区称为「寓言禁令」。

《华尔街日报》的报道显示，Anthropic 已调整相关策略，模型不再对纯虚构创作请求一律回避。调整的具体技术细节与生效时间未在标题层面披露，需要进一步查阅正文才能确认。

争议焦点：安全对齐与创作自由

这起事件折射出的是当前生成式 AI 行业普遍面临的一道难题：

过度保守：模型在被训练「拒绝有害内容」时，可能连同无害的虚构创作也一并拒绝，影响用户体验与创作类应用。
管控不足：若完全放开，又可能放大幻觉、虚假信息或被滥用生成有害叙事的风险。
政策透明度：用户往往不清楚模型为何拒绝或允许某一类请求，厂商也面临公开内部准则的压力。

报道标题中的「tame AI」一语，正对应这种在「对齐强度」与「可用性」之间的拉扯。

行业意义与待观察问题

Anthropic 的政策变动并非孤立事件。在过去一段时间里，多家前沿模型厂商都在不同程度上重新审视其内容策略，包括放宽对纯虚构写作、角色扮演、特定题材讨论的限制。

不过，本次报道留下的关键信息仍较有限，例如：

调整仅限虚构故事，还是覆盖更广的内容类别？
是否伴随系统提示、RLHF 训练数据或安全分类器的实质变更？
Anthropic 是否对外发布说明文档或博客解释此次改动？

这些细节决定了本次「解禁」究竟是象征性的口径变化，还是产品层面的真实升级。后续值得持续关注厂商的一手声明与社区测试反馈。