他们自己写的毕业论文,被认定长着一张AI的脸

  看到 AI 检测系统里,毕业论文成片的红色和黄色时,舒然感到“欲哭无泪”。她在心里反问自己:难道我长得这么像 AI 吗?

  在舒然两万三千字的论文中,有几十段文字被检测出“中风险”和“高风险”。舒然解释,这意味着自己的毕业论文虽是原创的,却因为“AI 率较高”无法达到学校论文过审的要求。

  随着 AI 的流行,不乏学生会在论文写作时借助 AI 生成。根据一些高校的官网消息,针对 2024 届毕业生,这些学校首次发布了有关 AIGC(生成式人工智能)检测的通知,明确学生在进行毕业设计(论文)时,应严格遵守学术规范和学术道德,避免过度依赖智能生成内容,确保毕业设计(论文)的独立性和原创性。

  接受采访的学生们都认为,AI 检测某种程度上的确可以防止学生用 AI 代写论文,但是目前的 AI 检测功能尚不成熟。“很难理解它是怎么判断为 AI 写作的,因为就算是人工写作,或者经过修改,也会再次检测成 AI 代写。”舒然说,用科技制裁科技的结果,会导致跟论文的要求相反。

  对于那些被误判为 AI 写作毕业论文的学生,机器反馈给他们一个数字,他们没有申诉途径,只能按照机器的运行逻辑修改。一个明显的悖论是,当人工智能越来越像人类时,人类自己写的句子也越来越像人工智能。此时,用 AI 检测是否使用 AI 代写,他们的论文被误判为 AI 代写的可能性就越高。

  从“中风险”改到“高风险”

  今年 4 月底,即将大学毕业的舒然和导师讨论后,定下了自己毕业论文的题目。

  一个月后,舒然开始写论文初稿。撰写论文期间,她已经进入一家公司实习。每天下班后,她趴在电脑前绞尽脑汁,写到半夜才休息。周末两天,她把所有时间都投入到论文写作中。

  因为提前和导师商量好了论文的结构框架,写作过程中,舒然的思路较为清晰和顺畅。除此之外,导师对她的论文格式,包括目录、字体、表格的线条等都提出了更细致的要求。

  大概过了半个月,她写完论文初稿。按照学校的要求,她的毕业论文字数要在两万以上。一遍遍修改后,舒然的论文字数停留在两万三千字。

  学校的另一个要求是,除了一般的查重外,学生需使用一款叫“格子达”的 AI 工具作为论文引用检测系统,检测的结果必须是“低风险”。

  舒然通过上网查询得知,这款软件能够提供论文查重、格式检测、格式校正、论文管理等功能。论文查重主要通过与期刊数据库比对,找出论文中内容的重复率。

  不同的查重系统算法和数据库大小不一样,比如知网查重的规则是 13 个字符,即 6.5 个字连续重复就会被标红。而 AI 检测的目的在于识别出哪些内容是由 AI 生成,通过分析语言风格、检测重复内容、语法和逻辑进行判断。

  写完论文初稿一个星期后,舒然发给导师。导师提出修改意见后,她从标题到框架全部“人工”修改了一遍,直到对自己满意为止。在答辩前两周,她将论文提交到 AI 工具里检测。

  在舒然提交之前,她的一个室友先进行了 AI 检测。结果是查重率 13%,AI 检测“中风险”。室友对此结果并不意外,她告诉舒然,自己的论文有一部分是 AI 代写的。

  当时舒然觉得“还挺新奇”,但她心想,这样的论文肯定重率高,自己的论文都是一个字一个字写的。当舒然把论文提交后,出现在她眼前的查重率只有1%,但 AI 报告也是“中风险”。

  这意味着,她必须降 AI 率,从“中风险”降到“低风险”。

  和舒然一样,四川大学生林天乐的毕业论文也被判定为 AI 代写。今年毕业前两个月,林天乐突然接到学校要求查 AI 率的通知。交论文截止日期的前一天,他才知道学校要求学生使用维普论文检测系统,系统显示,可以用 AI 语言模型检测 AIGC 实现快速、准确识别学术文本中的 AI 生成内容,可有效识别文本是否部分或全部由 AI 模型生成,检测结果与论文质量无关,仅表示论文中内容片段存在 AI 生成可能性的概率。

  林天乐学校要求,AI 率要低于 30%。超过这个比例,论文盲审不能通过,就无法毕业。他上传论文后,查出来的结果是 37%。林天乐表示,标成 AI 的那些内容,都是他自己写的。

  在这之前,他已经在知网上查过一遍,查出来的重复率是百分之零,所以他对自己的论文比较放心。直到要交初稿的当天,老师建议他再加新的内容进去,他又继续修改,到下午才定稿。“感觉自己这么努力,到交之前还手忙脚乱, AI 率却被判为 37%,内心挺气愤的。”

  林天乐在社交平台上吐槽检测结果。本文图片均为受访者供图

  因为已经保送了研究生,林天乐对自己的论文要求较高。每天早上 9 点,他就跑到实验室打卡写论文,一直写到晚上八九点,有时候熬夜写到十一二点。持续了一个学期,论文写了近四万字。

  原本信心十足,读博士的师兄也夸赞他论文内容丰富,图表画得好看,查重率从来没超过3%,却被检测出 AI 代写,林天乐心情跌落谷底。

  你的 AI 率降下来了吗?

  刚开始改论文,舒然根据软件里标红和标黄的提示,自己琢磨修改。对于那些跟其他内容相似的句子,“看着它有点像 AI”,便逐字逐句地改。

  她念的是国际经济与贸易专业,论文中涉及不少专业术语的概念解释。但令她苦恼的是,这些固定的解释最容易被 AI 系统标红,而她又无法“创造出一个新的概念”。

  她的具体修改方式是,用同义词替换,或者调整一下句子的顺序,或者用一些更“高级”的词汇,以此对抗“AI 给出的机械和低级的词句”。但她没想到,再次检测的结果竟变成了“高风险”。

  舒然内心彻底“破防”。她并不知道其中的算法和规则,只知道软件会标出不同的风险段数,标红的是高风险,标黄的是中风险,标绿的是低风险。第一次检测结果中,她论文中的“中风险”有 35 段,改完之后变成了五十几段。

  舒然修改论文后变成“高风险”。

  论文被判成“高风险”之后,舒然先冷静了一个晚上。第二天,她开始上网到处搜索降低风险的方法。刚开始,她尝试了几款可以降 AI 率的 AI 工具,“但都没啥用。”

  之后,她又搜到一些大学毕业生降 AI 率的经验分享帖,说要去掉论文中“首先”、“其次”、“和”等字词,以及调换语句和语序等等。她用这种方法再次修改了一遍论文,论文又变回到“中风险”。

  改了一天后,又回到起点。舒然觉得这样的修改方法太慢,于是继续上网搜寻。这次,她通过提炼其他人降 AI 率的经验,总结出一句她背得“滚瓜烂熟的法则”,即“复杂变简单,正话反说,主动变被动,简单变复杂”。

  距离交论文定稿的时间只剩下两天,舒然和室友们的论文都被判为“高风险”或者“中风险”。“她们有的是用 AI 代写的,有的是从别人论文里面抄的,也有自己写的”。舒然说,她们检测结果相似,都是查重率不算很高,但是 AI 率很高。

  熬到凌晨三点,那个晚上,宿舍里彼此间说得最多的话是:“你的 AI 率降下来了吗?”

  学校虽然提供了一次免费的检测机会,但舒然想用在最终稿上,因为检测报告一出来,系统会直接提交给老师。她先后自己花了 200 多块钱,购买了四次检测机会。

  她感觉论文像做了一次次体检,“检查出来都是病。”报告很详细,“甚至可能就几个字重了,也会标红。”

  降 AI 率的过程中,舒然脑中盘旋的一直是导师的话:论文过不了,会影响毕业。答辩之后还会抽查,抽检不过关的,后果很严重。

  天快亮的时候,舒然不记得是第几次改完整篇论文。再次检查,虽然报告上仍有几段显示是“中风险”和“低风险”,但整体结果是她无比期待的“零风险”三个字。

  她舒了一口气,迫不及待跟同学分享自己降 AI 率的方法,熬夜帮室友的论文改至“低风险”。“室友开心得不得了,说你就是我们宿舍的神。”

  但是舒然感觉,她把室友的论文也改得“难以入目”。为了降 AI 率,她和其他同学一样,不再顾及论文内容的通顺和流畅。不过,最后她还是顺利通过了答辩。

  和舒然一样,林天乐也上网搜寻了各种降 AI 率的方法。同学建议他用 AI 软件降 AI 率,他拒绝了。自己又重新写了三遍,最后一气之下直接“爆删”。

  但论文查出来的 AI 率仍有 30.13%,他觉得自己可能要延期毕业了。他记得那个夜晚,班里几乎所有同学跟他一样,因为 AI 率通宵熬夜修改论文。

  起初,学校通知是这天零点前交稿,由于 AI 检测系统不稳定,很多同学没有成功交上去,学校不得不把截稿时间推迟到第二天的中午 12 点。

  林天乐后来降 AI 率的心得是,少用连接词,句中多用逗号,多个短句共用一个主语。

  为了更快速和高效,被检测标红的部分,林天乐全部删掉,直接再重写一遍。改了三遍之后,论文中仍然有标红的地方,他继续改写一遍,最后 AI 率只降了不到7%。

  截稿时间越来越紧迫,他只能继续删掉标红的几千字。他知道这对论文内容有一定影响,“观感没有之前那么好,但是没有办法,至少能顺利毕业了。”

  “故意暴露人类的缺点”

  当同学问舒然降 AI 率的方法时,她半开玩笑地说,其实就是“故意暴露一些人类的小缺点”,比如写得没那么通顺。

  降 AI 率成功的喜悦没有持续几分钟,舒然开始感到失落。自己用尽心思写出来的论文,经过“缝缝补补”,最后变得“支离破碎”,并没有达到她想要的目标。

  这也让她思考,当 AI 越来越智能化,它写出来的东西“很高级、很专业,越来越接近人类时,又用 AI 检测系统让我们去降低 AI 率,那不就是把我们自己变得不像人类了吗?”舒然觉得,这是一个悖论。

  舒然论文修改前被 AI 标黄。

  舒然论文修改后不再被标黄,但语句变得不通顺。

  针对被误判的行为,受访大学生们的共同疑问是,程序是怎么判定的?“很多人用 AI 是为了将自己的口语变得学术化,现在为了避检,却要故意将学术化语言改得更口语化。”浙江一所高校的大四毕业生古思琪说。

  去年 12 月,古思琪完成了毕业论文的开题报告。今年 2 月,她开始写初稿。查阅资料、构思和写稿,大概花了两周时间,她把论文初稿交到老师手中。之后再根据老师的建议修改,一篇本科毕业论文便算完成。

  古思琪就读的学校今年也有新的规定。不同于往年的纸质版定稿,学生需通过知网系统上传论文。定稿之后,到了 5 月,学校才通知学生,要查 AI 率。古思琪心想,我都写好了,不会再改了吧。“老师只说如果评优的论文(AI 率)需要在 10% 以下,但没有说合格的论文 AI 率要低于多少。”古思琪回忆。

  论文上传到检测系统后,古思琪发现,她自己写的某一段话,“一个逻辑性很强的结论”,却被认定为是 AI 写的。虽然没有具体的比例要求,但老师说尽量把论文的 AI 率降下来。降之前,古思琪论文的 AI 率是 38%。

  于是她不得不把逻辑词去掉,让前后句子的关联度变弱,或者调换段落顺序,或者把几段内容压缩成一段。打乱之后,“反而更像是机器写的了。”不过改了半天后,论文的 AI 率的确降了下来。

  但是古思琪觉得自己论文中“亮点的内容”,最后都变得“平平无奇”。“这让我看论文的时候心里很难受”。

  她听说可以用 AI 降 AI 率后,也尝试过用 ChatGPT 和其他软件。当时她想清除关联词的部分,但最后的结果和她自己想写的“完全无关”。

  古思琪觉得,“AI 的逻辑和人的逻辑有一定的差距。它会带有一些人的想法,但是没有我们人写得那么顺畅,看着很别扭。”她说,AI 只会抓住一些关键词,识别论文是否是 AI 写的。所以,用 AI 来改 AI 率就显得很矛盾。

  反反复复修改之后,林天乐已经降低了自己的“学术要求”。强行改变行文逻辑,也让他感到“错乱”。“从小到大一直使用的连接词,可以让文章比较通畅,现在都不能用,好像已经变成 AI 专属。”

  虽然最后林天乐的论文如愿以偿被评为优秀毕业论文,但他仍有种无处诉说的冤屈感。“根本没用过 AI 写,难道要让人承认没做过的事情吗?”他为此难过了几天。

  科技“制裁”科技

  一篇论文生产提交的前后,AI 作为使用的辅助工具,再用作检测 AI 代写的系统,之后再成为降 AI 率的工具,“AI 主导了一切”,林天乐说。

  林天乐的专业是自动化方向,有时他会使用 AI 询问某句代码的相关含义,“AI 会给出比人更加耐心和详细的回答”。他认可 AI 是一种实用工具。但是对于通过 AI 查论文的 AI 率,他觉得检测标准和准确率并不能令人信服。

  林天乐曾将自己的困惑告诉论文指导老师。老师觉得,检测系统目前的确不太智能,但学校已有相关规定。除了鼓励他加紧修改外,也没有其他办法。

  林天乐就读的学校今年是第一次进行 AI 检测毕业论文。虽然系统还在公测阶段,但已经开始使用。“之前不是说《学位法》要检测 AI,但是最终法律把 AI 那条删掉了。因为它本来就只能根据简单的措词来判断,而且是疑似。”

  他指的是在 2023 年 8 月审议的《中华人民共和国学位法(草案)》中,草案明确学位论文或者实践成果存在抄袭、剽窃、伪造、数据造假、人工智能代写等学术不端行为的,经学位评定委员会审议决定由学位授予单位撤销学位证书。

  但在今年 4 月最终颁布的《学位法》中,人工智能代写并没有被纳入学术不端行为的考量。“不过一些学校目前已经开始进行 AI 检测”,重庆一所高校的老师说,高校引入“AIGC(生成式人工智能)检测服务系统”,多是出于学术诚信的考虑,确保论文的原创性,并以此抵制人工智能代写论文的行为。

  部分学校的通告显示,人工智能工具仅可用于文献检索、数据处理等辅助工作,严禁直接应用于论文撰写。但是,不同学校对于人工智能生成内容比例的要求并不相同。

  在拼命降 AI 率的过程中,古思琪有同样的困惑:“AI 的判断,是准确和可靠的吗?”

  她听有同学说自己在致谢里感谢某位老师的话语,也被标成 AI 写作了。她不知道自己的论文被判为 AI 代写的原因,改起来也无从下手。最初改完之后一查,只下降了1%。

  最后有几段内容,她实在不知道怎么修改,也不能删掉。于是她用降重的方法,先翻译成英语,再翻译回中文,AI 率最终降到学校要求的 15%。她身边有同学为了降 AI 率,先把中文翻译成爱沙尼亚语,再翻译成中文。

  古思琪同组内有一个同学,论文的引言和致谢都是 AI 写的,就这样直接发给老师后,老师把学生“痛批”了一顿,“这样的行为肯定是学术不端。但是如果自己的想法大于人工智能的参与,AI 就只是一种工具。”

  在学校要求开始查 AI 率之后,古思琪跟导师交流过。她的导师平时很喜欢使用 AI 辅助教学,也不限制学生使用 AI。导师觉得使用 AI 能帮助学生拓展思维,“比如 AI 给出了三种想法,如果你能不限于 AI 的想法,拓展出四五种,就掌握了和 AI 互动的主动权。”

  未来,古思琪打算读研究生,她认为之后的论文可能都会进行 AI 检测,检测是必要的,“因为现在的确有很多人直接用 AI 代写”。但是她自己写的内容,也被判定为 AI 代写,说明系统还不完善。

  六月,舒然通过了论文答辩,顺利拿到了毕业证。毕业论文躺在她的电脑中。偶尔,她会回想起降论文 AI 率的“痛苦过程”,好像只是“稀里糊涂”完成了一个任务。

  对于那个判定她代写的系统,她依然一无所知。

  (为保护受访者隐私,文中人物均为化名)