AI 能写出下一部伟大小说吗

随着大语言模型渗透进日常写作、新闻生产乃至文学创作领域，人类与机器文字的边界正变得前所未有地模糊。一项来自兰卡斯特大学法庭语言学家 Claire Hardaker 的在线测试显示，普通读者在 15 段文本中准确识别 AI 生成酒店评论的成功率只有约 60%，远低于许多人对自己「火眼金睛」的自信。

那些「识别窍门」为何不灵

人们在判断一段文字是否为 AI 生成时，往往依赖一些看似直观的「经验法则」：是否过度使用陈词滥调、是否频繁出现破折号、是否符合「三段式」修辞（即把三个词或短语排成节奏感强烈的并列结构）。但问题在于，这些特征本身就是人类写作中长期存在的传统。Hardaker 指出，从狄更斯到凯撒的「Veni, vidi, vici」（我来，我见，我征服），人类作者使用破折号与三段式的历史远比大模型更悠久。依赖这些「捷径式」线索，反而容易把写得工整的人类作者误判为机器。

文学与媒体界的信任危机

正因识别困难，怀疑情绪迅速蔓延。2025 年 5 月，作家 Jamir Nazir 凭借短篇小说获奖后因风格争议遭社交媒体猛烈质疑，尽管他随后向《大西洋月刊》表示并未使用 AI；Hachette 出版的恐怖小说处女作《Shy Girl》因网上流传的使用 AI 传闻被作者主动撤回，作者本人予以否认；学者 Steven Rosenbaum 的《The Future of Truth》一书则被发现含有大量「幻觉式」虚假引述，作者为此公开致歉。《卫报》等媒体也透露，近期收到的关于稿件疑似 AI 生成的读者投诉显著增加，其中甚至包括对个别错字、重复词的过度解读。

检测工具也并非万能

市面上号称能区分人类与机器写作的检测工具同样存在不确定性。Hardaker 作为曾出庭作证的专家，对商业检测器持「极度怀疑」态度，因为神经多样性人群等本身就具有「类 AI」风格的写作者，容易被误判；而人类作者也完全可以对 AI 输出进行「拟人化」修改，绕过检测。较新的检测服务 Pangram 宣称其误报率约为万分之一，在独立测试中对经过「人类化」工具改写后的 AI 文本仍表现出较高准确率，但本文作者本人在首次尝试中即通过模仿一种「浮夸」语体成功「骗过」了它——而这种风格既可能是 AI 的典型特征，也可能只是某位长期浸润于 ChatGPT、Claude、Gemini 输出之中的写作者的自然习惯。

语言本身正在被改写

更深远的影响在于，海量 AI 文本正在反向塑造人类语言习惯。有研究者早在 2024 年就通过学术论文数据库统计发现，「delve」（深入探究）一词的使用频率在 LLM 流行后突然飙升；其他被 AI 反复使用的「焦点词」还包括「showcase」（展示）、「boast」（拥有）、「underscore」（强调）、「garner」（获得）、「align」（契合）、「surpass」（超越）、「intricate」（错综复杂）等。从自动生成的邮件建议、搜索引擎的「AI 概览」，到聊天机器人的回复与广告文案，AI 文本已经包围了现代人的阅读与写作环境。在这一暴露程度下，问题不再是「AI 是否正在改变语言」，而是「它正在如何改变语言，以及我们究竟应该抗拒还是拥抱这种改变」。