论文被判 98% 由 AI 生成，大学生面临失学

近日，Reddit 上一篇求助帖引发海外社交平台广泛关注：一名美国大学生声称，自己花了六个月完成的约 30 页本科毕业论文，被学校使用的 AI 检测系统判定为「98% 由 AI 生成」，面临论文成绩作废、学术停学以及每年 4.5 万美元奖学金被取消的多重风险。这笔奖学金折合人民币约 30.6 万元，几乎覆盖其全部教育开支。事件迅速将「AI 检测工具是否可靠」这一老问题再次推上风口浪尖。

事件经过：创作记录未被采纳

据这名学生描述，他就读于纽约州一所私立大学。为证明论文是自己逐字逐句完成的，他在听证会前特意携带了笔记本电脑，希望通过 Google Docs 的版本历史展示完整的写作过程：

文档从空白页面逐步扩充为完整论文；
修改、删减、重写的痕迹清晰可见；
连打字错误与修正过程均有记录。

然而，纪律委员会并未查看这些材料。校方表示，政策要求以 AI 检测软件的官方报告为依据，并称该系统「经过高度校准且非常准确」。换言之，决定他学术命运的，几乎只剩下一个 AI 检测分数。

检测工具的「黑箱」与已知缺陷

事件发酵后，评论区大量网友分享了类似经历。其中最受关注的一条来自一位退休材料科学工程师：他发表于 1976 年的研究论文——比 ChatGPT 诞生早了近半个世纪——也被同类工具判定为「98% 以上由 AI 生成」。另有网友测试发现，在西班牙语文章中刻意加入古典词汇与复杂表达，AI 检测率反而上升约 20%。

学术界的实证研究同样表明问题并非孤例：

斯坦福大学研究人员测试发现，非英语母语学生撰写的 TOEFL 作文中，超过 60% 被错误标记为 AI 生成；
研究者认为，AI 检测器有时并非在「识别 AI」，而是在「识别写得太规范的人类」。

连检测工具的开发者也态度审慎：Turnitin 曾公开表示，AI 检测结果不应作为认定学术不端行为的唯一依据，教师需结合课程背景、学生表现及其他证据综合判断。

部分高校已主动弃用

面对误判风险，不少美国高校已重新评估 AI 检测工具的使用方式：

2023 年，范德堡大学宣布关闭 Turnitin 的 AI 检测功能，校方认为即便误判率仅为 1%，在年度约 7.5 万份论文体量下，仍可能造成大量错误指控；
康奈尔大学与杜克大学曾发布指导意见，明确指出 AI 检测工具无法提供足够可靠的证据，不应单独作为处分依据。

算法背后是真实的人

这场争议的核心在于：当算法给出「98% 由 AI 生成」这样看似精确的数字时，人们往往会赋予其权威性，但大多数 AI 检测系统属于「黑箱」，判断过程不可见，最终承担后果的却是真实的学生。截至目前，该学生已开始咨询法律意见，包括向学校正式申诉，以及评估是否通过法律途径挑战相关决定。

这起事件再次把一个全球高校正在面对的难题摆到台前：当 AI 被用来识别 AI 时，人类究竟该如何证明自己是人类？