首页 > 实时讯息 >
如何证明我不是AI?毕业论文的检测疑云
0次浏览 发布时间:2025-05-07 15:00:00
目前四川大学、华中科技大学、天津科技大学等国内高校出台规定,要求检测毕业论文的AI率。(视觉中国/图)
2025年4月16日,四川大学计算机学院学生赵朗向校长邮箱发送了一封邮件,主要内容是对AIGC检测提出质疑。
AIGC(Artificial Intelligence Generated Content)检测,俗称为AI率检测,是指对论文里人工智能生成内容的检测,是鉴别论文原创性的一个指标。
2025年4月9日,四川大学教务处发布2025届本科毕业生论文学术不端行为检测工作的通知。其中要求,文科类毕业论文AI生成内容占比不超过20%,理工医科类毕业论文不能超过15%。
赵朗是今年要毕业的本科生,他和同学们发现,AI率检测并不靠谱。数学系拔尖班的同学向他吐槽,即使论文的主体内容都是数学公式,仍能出现30%多的AI率。
赵朗的校友、川大医学院2025届本科生江霖也有类似遭遇。他在4月初就完成了毕业论文,本以为高枕无忧,却未料到,差一点没能通过论文AI率检测。
江霖的论文被检测出来的AI率高达56.8%,这令他难以理解和接受——这篇近8000字的本科毕业论文,主体内容都由自己独立完成,前前后后改了七遍,论文指导老师每次都逐字逐句修改,还留下了很多详细的批注。
江霖坦言,他仅在文章极少数表达不流畅的段落使用AI润色,“但AIGC检测标出的部分都是我自己写的,润色部分反而并未标出。”
据南方周末记者搜索,从全国来看,目前要求检测AI率的学校还是少数。截至目前,只有华中科技大学、天津科技大学、福州大学等高校出台规定,要求检测毕业论文的AI率。与这些高校合作的检测平台大多数为知网和维普。
同济大学法学院互联网与人工智能法律研究中心主任张韬略在2025年1月曾发表《何以透明,以何透明:高等教育的AIGC剽窃与技术之治》一文。他向南方周末记者解释,部分学校要求检测AI率的主要原因是确保毕业论文的诚信写作和防止剽窃。“但实际上,AI本身就在模仿人的各种表达,技术发展越好,AI的输出就越接近人类的表述。”
检测误差
“论文中引用法律法规文件内容被识别为AI生成,实习时的访谈对话也被整段整段识别为AI生成,AIGC检测率直接超过50%。”陈莉在社交媒体上表达了她的困惑。
陈莉是江苏某高校学前教育专业2025届本科毕业生。她在毕业论文完成当天进行了第一次AI率检测,检测结果竟高达50%,而学院的要求是40%,老师告诉她降到30%才比较稳妥。
除了将人为写作识别为AI生成,不同时间进行AIGC检测的结果可能也完全不同。
法制史专业2025届本科毕业生邹冉所在学校的要求更为严苛——AI率不能高于30%。
由于计划出国读研,邹冉早早完成论文,在2月底就已定稿。维普当时给出的重复率为17.7%,AIGC检测率为0.84%。
3月中旬,学校通知维普的检测系统更新,要求重新检测。在一字未改动的情况下,邹冉论文的重复率没变,但AI率却飙升至41.3%。她看到结果时很震惊,同时有种深深的无力感。
在邹冉论文摘要的345个字中,有343个字被识别为AI生成,AI率高达99%。但邹冉很清楚,初稿的摘要曾被指导老师批评,说像小学生写的,“老师说摘要是整个论文的核心,让好好琢磨,我在他的建议下逐字逐句修改了四遍。”而整篇论文,“指导老师每次通篇认真修改,连标点符号都不放过。”
还有更深的困惑。这篇论文讨论的是明清时期的商业制度,邹冉引用了1904年颁布的《商部奏定商会简明章程》的部分内容。结果这些引用部分都被系统标为紫色,被认定属于AI生成内容。
3月14日晚上,陈莉发朋友圈吐槽AI率检测结果,“维普的AIGC检测就是人工智障。”看到她的朋友圈后,汉语言专业的朋友告诉她,自己论文中引用朱自清的《背影》片段同样被标为AI生成。那一刻,陈莉的怒气消失了,只感到滑稽。
赵朗告诉南方周末记者,2025年4月18日,他使用ChatGPT-4.5生成一篇文章,AI率的检测结果是10%。因此,他猜测,可能越新的模型生成的内容,被检测出来的AI率越低。
在更大范围内,对AI率检测存疑的学生和老师也不在少数。
江霖所在班级有三十多人,很多人都在吐槽AI率检测。“班上不少同学都发表过SCI论文了,平时成绩也很靠前,完全有能力自己写毕业论文,但AI率检测超过80%”。
心急如焚的邹冉也在微信问指导老师,对方回复“等等学校教务怎么处理,因为很多老师也反映了相同的问题,真的是瞎搞”。但几天后得到的反馈是“学校强制要求,没办法”。
江霖班上一位论文AI率符合要求的同学自称“语言习惯比较特别:多定语、长难句,偏向散文风格而非科技论文风格”,但他论文的摘要和总结用语较为规范的部分则在检测中都被标为AI生成。
江霖甚至总结出了规律:专业化、简洁、高度凝练和学术化的表达,更容易被判定为AI生成。
除了检测结果本身的误差,学生们也很在意AI率检测带来的额外经济负担。
以知网为例,AIGC检测单价为2元/千字符,不足千字符的部分按千字符计算。维普的检测价格按篇计算,每篇20-38元不等。邹冉的论文单次AIGC检测费用是20元,即便单价并不高,但她进行了多次检测,也花费200多元。
赵朗说,虽然学校提供一次免费检测,但由于检测结果不靠谱,学生往往需要反复检测。截至4月19日,赵朗已有同班同学为此花费480元。

AI的横空出世和廉价供给,会催生大量隐蔽的机器代笔行为,极大影响毕业论文的质量控制。(视觉中国/图)
算法黑盒
这些困惑的师生好奇的是,AI率检测的原理和判定标准是什么?
陈莉记得,学院副院长在上课时也说并不清楚这一检测的原理,老师们也是第一年接到通知。
根据知网官方解释,其AIGC检测服务系统是以知网结构化、碎片化和知识元化的文献大数据资源为基础,按照预训练大语言模型的算法逻辑,从语言模式和语义逻辑两条链路,用AI对抗AIGC;而维普则表示是基于其现有的查重数据库和技术框架进行扩展,利用自然语言处理和机器学习算法来识别AI生成的内容。
一位从事人工智能方向研究的青年学者向南方周末记者分析,知网和维普大概率是根据数据库中已有的文章,做分类模型,将检测文章输入,从而判断哪一段是AI生成,哪一段又是人为写作。
但问题是,检测结果的可靠性与数据库中已有数据密切相关,如果出现相对小众领域的文章,模型不成熟,检测结果出现误差的概率更高。
某985高校从事人工智能方向研究的博士生向南方周末记者解释,“大语言模型每次训练时分为正样本和负样本,正样本是人为写作内容,负样本是大模型生成内容,大语言模型会朝着越来越逼近真人的方向发展,整体语言风格也会越来越像真人。边界愈加难以分清,这种情况下进行AIGC检测,肯定会产生误差。”
“AIGC是黑盒算法,目前公众和绝大部分高校教师对AIGC内部运作机制和识别机制都不熟悉,就将其作为判断标准,可能不是很靠谱。”上述博士生表示。
清华大学计算机系自然语言处理实验室副教授刘知远向南方周末记者解释,如今互联网上的大模型非常多,如果文章由B模型产出,再让A模型去检测,可能无法得出准确结论。“因此,判断一篇文章是否由AI生成,本身的准确率可能有较大的波动。”
但他强调,虽然AIGC检测有一定误差,准确率达不到99%,但也不会低于60%。因此,虽然有部分学生被冤枉,但也有大量的学生由于使用AI生成而被发现。
针对AI率检测一事,南方周末记者联系知网和维普要求采访。知网并未正面回应,只是强调公司会定期组织相关信息分享。截至发稿,维普暂未回应。
在尚不清楚AIGC检测原理的情况下,学校为何要将其引入,成为学生毕业论文的硬性要求?
周奕是某医科高校教务部的老师,学校在2024年就开始进行AI率检测。针对此举初衷,周奕解释,主要为了提高对论文原创性的要求,同时侧面引导学生遵守学术伦理,在合理范围内使用AI。
学校的硬性规定是不能超过40%。周奕发现,2024年AI率检测结果的总体准确性和可靠性还比较高——仅有1%左右的论文检测结果超标,学校进一步核查,发现这些同学的确在论文写作的不同阶段都借助了AI。
由于2025年的论文答辩还未开始,周奕目前还未掌握今年的数据。但他感觉,学校师生已经逐渐接受这个新检测。
同济大学目前并未出台AIGC使用的相关规定,张韬略也与本校科研处的老师交流过这一问题,“他们认为技术发展太快,担心开展AI率检测反而容易出问题”。
目前,一些高校将AI率作为硬性指标,与毕业论文能否通过挂钩。周奕说,他们学校只将AI率作为参考,如果超标,指导老师需引导学生修改。
刘知远指出,将AI率检测作为参考是合理的,但不能作为唯一的评判标准。可行的方式是学生在论文答辩时同步提供检测报告,评审老师们重点关注AI率较高的论文,确认是否存在问题。
用AI降AI
当一个个段落被标为AI生成,AIGC检测率居高不下,为了毕业,学生们只能妥协——想方设法降低AI率。
陈莉将标出的内容一点点细致修改,“改善课程评价的维度”被改为“课程评价方式变得更多”,“反正尽量口语化”;而改不了又不影响主体内容的便只能删除。
邹冉也修改了两版,第一版完全口语化,调整语序,同义词替换,最终文本“惨不忍睹”。
于是,她选择另一种办法,将16000字左右的文章删减1500字,最终AI率勉强降至28.09%。得知结果后,邹冉的老师也很激动,“29.99%也行,赶紧交,别管了,就当应付一下学校。”
南方周末记者曾数次询问邹冉,在写作过程中是否用到AI,她都予以否认并解释,“我写的是清末民初时期的,并不合适用AI,而且AI给出的信息可能不太准确。”
邹冉提到的其实是AI幻觉。
张韬略解释,AI幻觉目前很难根除,这种特征也决定了普通大模型不适合做学术类的生产,AIGC的稳定性和精确度远远未达到学术创作的标准。
江霖选择用魔法打败魔法——也就是用AI软件降低AI率,将书面化的表达改得更为口语化,避免复杂的连接词和并列句,调整语序,增减字数,替换同义词等等。
在此之前,江霖曾尝试修改数遍,导师也帮忙一起修改,但由于他们并不知晓技术的判定标准和背后的算法,改来改去,AI率居高不下。
最终,通过AI软件,江霖得到了一篇充斥着口水话、句子结构和逻辑关联很弱,但AI率检测为0的杂乱文章。
从AI生成,到AI检测,再利用AI软件来降AI率,这看似很荒谬。
张韬略解释,这实际上是知识生产范式中自我证明的困境。“当一个机器能够进行与人类同等程度的知识生产,至少在外观上可能接近甚至是超过人类时,也会导致我们对整个文本的来源产生质疑。” 他还表示,人类代笔的成本和风险较高决定了其规模和影响较小,AI的横空出世和廉价供给,会催生大量隐蔽的机器代笔行为,极大影响高校毕业论文的质量控制。
在赵朗向校长邮箱发送邮件两天后,学校教务处的老师联系学院,让学院与几位学生代表当面交流,收集意见。
此后不久,学校为全校毕业生增加了一次免费检测的机会。
刘知远认为,就眼下的情况而言,高校出台的检测手段也是不得已之举。这些学校目前也处于探索阶段,一旦有很多学生提出质疑,学校可能也会不断修改完善。
提高透明度
如果目前论文AI率的检测技术还不够成熟可靠,有什么新办法可以防止学生用AI代写论文?
张韬略的观察是,从提高生产效率的角度,学生必定会应用AI,也应该鼓励学生掌握AI,问题在于应该如何负责任且合乎伦理地使用。因此,重点是需要提高使用过程中的透明度。“明确标注哪些内容是AI生成,借助AI进行了哪些修改,这种透明度的声明也能够让作者避免可能的侵权责任。这可能需要学术界和教育界慢慢引导,从而形成良性的发展空间。”
2024年11月28日,复旦大学教务处发布了《关于在本科毕业论文(设计)中使用AI工具的规定(试行)》,明确列出了禁止使用AI工具的范围,当时被媒体称为“全球最严AI新规”。该校教务处相关负责人在接受媒体采访时解释,规定细化了AI工具的使用边界,在有限的范围之内鼓励、允许学生来使用AI工具。
值得一提的是,很多美国高校并未引入AIGC查重。
美国马里兰陶森大学英语系助理教授陈剑芬告诉南方周末记者,“我们不对学生的论文进行AI率检测,事实上,我们也不鼓励这样做。”作为从事专业写作和沟通教学与研究的学者,她认为,由于当前AI检测工具并不稳定,大部分教师也不知晓它的检测率是如何得出的,很可能导致师生间产生不必要的争端。
陈剑芬举例,美国就出现过类似案例,有位高中生写了篇英语论文,但老师认为论文是AI生成的,控告学生学术不端,学生不承认,反而上诉,最终学生胜诉。
在日常教学中,陈剑芬和其他老师一样,倾向于和学生分享该如何使用AI,向学生举例说明,什么样的情况下使用AI有助于写作过程,而什么情况下则是有损于思考进程的。“因此,学生和老师都是开诚布公的,不管是否使用AI,核心目标是让学生在学习过程中能够更有成就感,写作能力有所提高。”
张韬略也强调,老师首先要熟练掌握AI工具,且能合乎伦理和诚信地使用AI,才能指导学生积极且正确地使用,这也是目前不少学校正在提升教师的AI素养的原因。
“在人机混合创作的时代,什么情况属于合理使用,哪类情况又属于学术剽窃或机器代笔,对与错的边界应如何划定,可能都需要教育界和学术界一起慢慢探索。”他说。
周奕则表示,在目前的情况下,教育部没有相关规定,各级教育行政部门也没有明确的指导意见,学校处于前期摸索阶段,“我们也亟须指导性的文件和管理办法”。
邹冉还记得,在3月底的预答辩过程中,有位同班同学在讲解完PPT后,被在场的一位评审老师询问AI率,得到的答复是17%。接着,那位老师的回答让邹冉震惊,“那是我的错觉,我以为你这得有90%多。”
那位老师也当场给出了判断依据:句子的风格很像AI,每一段话的内容都很短。几天后,预答辩结果出来,那位被质疑的同学没有通过,需要再次答辩。
我们到底是要相信人的判断,还是相信AI的判断,目前似乎还没有答案。
在答辩之前,邹冉心里没底,虽然AI率检测低于30%,她还是担忧。指导老师宽慰她,“这个问题很普遍,评审老师心里都有数。”
最终的结果让邹冉惊喜,她在预答辩中拿到了“优秀”。
(为保护受访者隐私,赵朗、江霖、陈莉、邹冉和周奕为化名)
南方周末记者 魏翠翠 南方周末实习生 尚昕怡
责编 钱炜
相关文章
- 2025-05-08 20:44:00 大四本科生已发14篇SCI论文?重庆大学:成立工作组核实
- 2025-05-08 17:23:00 Kimi进军社区!社区变现难,AI“钞能力”时代已落幕
- 2025-05-08 13:49:00 一图速览|“股市稳定健康发展”底气为何足?
- 2025-05-07 16:45:00 安徽多地中小学暑假时间,定了!
- 2025-05-07 15:00:00 如何证明我不是AI?毕业论文的检测疑云