AI 能写出下一部伟大小说吗
随着大语言模型深度介入写作与出版,人类与机器文字的边界日益模糊,准确识别 AI 生成内容的难度比想象中更高。
随着大语言模型渗透进日常写作、新闻生产乃至文学创作领域,人类与机器文字的边界正变得前所未有地模糊。一项来自兰卡斯特大学法庭语言学家 Claire Hardaker 的在线测试显示,普通读者在 15 段文本中准确识别 AI 生成酒店评论的成功率只有约 60%,远低于许多人对自己「火眼金睛」的自信。
那些「识别窍门」为何不灵
人们在判断一段文字是否为 AI 生成时,往往依赖一些看似直观的「经验法则」:是否过度使用陈词滥调、是否频繁出现破折号、是否符合「三段式」修辞(即把三个词或短语排成节奏感强烈的并列结构)。但问题在于,这些特征本身就是人类写作中长期存在的传统。Hardaker 指出,从狄更斯到凯撒的「Veni, vidi, vici」(我来,我见,我征服),人类作者使用破折号与三段式的历史远比大模型更悠久。依赖这些「捷径式」线索,反而容易把写得工整的人类作者误判为机器。
文学与媒体界的信任危机
正因识别困难,怀疑情绪迅速蔓延。2025 年 5 月,作家 Jamir Nazir 凭借短篇小说获奖后因风格争议遭社交媒体猛烈质疑,尽管他随后向《大西洋月刊》表示并未使用 AI;Hachette 出版的恐怖小说处女作《Shy Girl》因网上流传的使用 AI 传闻被作者主动撤回,作者本人予以否认;学者 Steven Rosenbaum 的《The Future of Truth》一书则被发现含有大量「幻觉式」虚假引述,作者为此公开致歉。《卫报》等媒体也透露,近期收到的关于稿件疑似 AI 生成的读者投诉显著增加,其中甚至包括对个别错字、重复词的过度解读。
检测工具也并非万能
市面上号称能区分人类与机器写作的检测工具同样存在不确定性。Hardaker 作为曾出庭作证的专家,对商业检测器持「极度怀疑」态度,因为神经多样性人群等本身就具有「类 AI」风格的写作者,容易被误判;而人类作者也完全可以对 AI 输出进行「拟人化」修改,绕过检测。较新的检测服务 Pangram 宣称其误报率约为万分之一,在独立测试中对经过「人类化」工具改写后的 AI 文本仍表现出较高准确率,但本文作者本人在首次尝试中即通过模仿一种「浮夸」语体成功「骗过」了它——而这种风格既可能是 AI 的典型特征,也可能只是某位长期浸润于 ChatGPT、Claude、Gemini 输出之中的写作者的自然习惯。
语言本身正在被改写
更深远的影响在于,海量 AI 文本正在反向塑造人类语言习惯。有研究者早在 2024 年就通过学术论文数据库统计发现,「delve」(深入探究)一词的使用频率在 LLM 流行后突然飙升;其他被 AI 反复使用的「焦点词」还包括「showcase」(展示)、「boast」(拥有)、「underscore」(强调)、「garner」(获得)、「align」(契合)、「surpass」(超越)、「intricate」(错综复杂)等。从自动生成的邮件建议、搜索引擎的「AI 概览」,到聊天机器人的回复与广告文案,AI 文本已经包围了现代人的阅读与写作环境。在这一暴露程度下,问题不再是「AI 是否正在改变语言」,而是「它正在如何改变语言,以及我们究竟应该抗拒还是拥抱这种改变」。
