论文被判 98% 由 AI 生成,大学生面临失学
美大学生论文被 AI 检测工具判定 98% 为 AI 生成,奖学金与学业岌岌可危,折射 AI 检测在高校中的可靠性争议。
- 重要性
- 55
- 新颖性
- 40
- 影响面
- 60
- 可信度
- 42
- 实质性
- 58
近日,Reddit 上一篇求助帖引发海外社交平台广泛关注:一名美国大学生声称,自己花了六个月完成的约 30 页本科毕业论文,被学校使用的 AI 检测系统判定为「98% 由 AI 生成」,面临论文成绩作废、学术停学以及每年 4.5 万美元奖学金被取消的多重风险。这笔奖学金折合人民币约 30.6 万元,几乎覆盖其全部教育开支。事件迅速将「AI 检测工具是否可靠」这一老问题再次推上风口浪尖。
事件经过:创作记录未被采纳
据这名学生描述,他就读于纽约州一所私立大学。为证明论文是自己逐字逐句完成的,他在听证会前特意携带了笔记本电脑,希望通过 Google Docs 的版本历史展示完整的写作过程:
- 文档从空白页面逐步扩充为完整论文;
- 修改、删减、重写的痕迹清晰可见;
- 连打字错误与修正过程均有记录。
然而,纪律委员会并未查看这些材料。校方表示,政策要求以 AI 检测软件的官方报告为依据,并称该系统「经过高度校准且非常准确」。换言之,决定他学术命运的,几乎只剩下一个 AI 检测分数。
检测工具的「黑箱」与已知缺陷
事件发酵后,评论区大量网友分享了类似经历。其中最受关注的一条来自一位退休材料科学工程师:他发表于 1976 年的研究论文——比 ChatGPT 诞生早了近半个世纪——也被同类工具判定为「98% 以上由 AI 生成」。另有网友测试发现,在西班牙语文章中刻意加入古典词汇与复杂表达,AI 检测率反而上升约 20%。
学术界的实证研究同样表明问题并非孤例:
- 斯坦福大学研究人员测试发现,非英语母语学生撰写的 TOEFL 作文中,超过 60% 被错误标记为 AI 生成;
- 研究者认为,AI 检测器有时并非在「识别 AI」,而是在「识别写得太规范的人类」。
连检测工具的开发者也态度审慎:Turnitin 曾公开表示,AI 检测结果不应作为认定学术不端行为的唯一依据,教师需结合课程背景、学生表现及其他证据综合判断。
部分高校已主动弃用
面对误判风险,不少美国高校已重新评估 AI 检测工具的使用方式:
- 2023 年,范德堡大学宣布关闭 Turnitin 的 AI 检测功能,校方认为即便误判率仅为 1%,在年度约 7.5 万份论文体量下,仍可能造成大量错误指控;
- 康奈尔大学与杜克大学曾发布指导意见,明确指出 AI 检测工具无法提供足够可靠的证据,不应单独作为处分依据。
算法背后是真实的人
这场争议的核心在于:当算法给出「98% 由 AI 生成」这样看似精确的数字时,人们往往会赋予其权威性,但大多数 AI 检测系统属于「黑箱」,判断过程不可见,最终承担后果的却是真实的学生。截至目前,该学生已开始咨询法律意见,包括向学校正式申诉,以及评估是否通过法律途径挑战相关决定。
这起事件再次把一个全球高校正在面对的难题摆到台前:当 AI 被用来识别 AI 时,人类究竟该如何证明自己是人类?
