关于ZAKER Skills 合作
钛媒体 8小时前

惩罚好文章的 AI 检测,逼出一门灰色生意

文 | 商业 DNA

今年,全国越来越多高校将论文 AI 率的检测结果与答辩资格绑定,具体标准不一,从 15% 到 40% 不等。

至于检测结果从哪里来,准不准确,全是问号。同一篇论文换个平台检测,AI 率能差 20 个百分点。合格与不合格之间,或许只隔着一次平台选择。

为了过关,部分学生把学术论文改得口语化。电商和社交平台出现了 " 降 AI 率 " 服务,一个商家该项服务的累计销量就突破了 4000 件。

灰产只是小事,关键在于判断的标准。有学者指出:学术论文越规范、越严谨,越容易被判 " 像 AI"。因为高质量学术写作的特征,恰好就是大模型训练时偏好的优质语料特征。

当标准如此,系统惩罚的恰恰是那些认真写论文的人。

01 量不准的尺

国内某知名医科大学的研究生陈璐有个观察:自己用大白话写出来的毕业论文,AI 率并不高。

但班上的学霸,硕士课题发表在 SCI 杂志上、影响因子也很高,用同一个课题写出的毕业大论文,AI 率却高达 30%。

" 他们都很无奈,就是因为写得太规范了。" 陈璐说。

这不是孤例。媒体用同一篇测试文本在三个平台检测,知网给出 AI 率 90.2%,PaperPass 给出 95.77%,PaperYY 给出 69.2%,最高和最低相差超过 20 个百分点。

不同平台之间差 20 个百分点,意味着同一篇论文从一个平台换到另一个平台,结果可能从合格变成不能答辩。

学生论文检测数字浮动,经典作品的结果更令人瞠目。有网友把《滕王阁序》和《岳阳楼记》输入同类检测系统,AI 率超过 50%。王勃写的骈文,范仲淹写的名篇,在这套系统面前,和一个研究生熬夜码出来的论文一样可疑。

2025 年,中国人民大学新闻学院副教授董晨宇,将团队耗时 3 年,追踪多个真实案例写成的论文提交至检测平台,被判定 AI 率高达 82.54%。而其中标红的 " 高度疑似 AI 生成 " 段落,恰好是他们最扎实的原创内容。

北京航空航天大学法学院教授裴炜给出了一个关键解释:多数 AI 率检测系统的原理是基于 " 语言预测 " ——分析大量 AI 生成文本,归纳出 AI 的语言习惯,再与学生论文进行比对。

但人类本来也会使用规范、重复的表达,尤其在学术写作这种高度格式化的领域。

" 没有 AI,人也可能做出类似的语词联系和表达。" 换句话说,检测系统不是在判断 " 是否 AI 生成 ",而是在判断 " 是否像 AI 生成的文本 "。

它没有能力区分站在屏幕前的,是一个写得规范的人,还是一台模仿规范的机器。

同济大学法学院互联网与人工智能法律研究中心主任张韬略直言,当前 AI 生成内容检测工具的技术成熟度存疑,若直接用于判定学生学术诚信,可能存在误判风险。

02 被逼出的灰色生意

当一个并不成熟的工具,拥有了学生毕业与否的能力,一切开始失控。

本科毕业生刘风总结出规律:越是逻辑清楚、用词规范,越容易被系统判定为 AI 生成;表达越随意、越口语,反而越容易过关。

她连续四五天对着检测报告改句子," 论文水平没多少精进,精力全耗在应付系统上 "。

具体操作包括把然而改成但,把例如换成比如,把综上所述删掉。有人刻意加了的、啊、呢、哦之类语气词。还有人把句号改成逗号,AI 率居然就此降了 20 个百分点。

更离谱的策略是中英互译,把论文翻译成英文再译回中文,结果专业术语 " 肿瘤微环境 " 变成了 " 身体里的小坏蛋 "。

学生的目的已经不再是写出好论文,而是向 AI 证明自己不是机器。当人需要证明自己是人,游戏规则就已经反了。

而规则正在催生出一条灰色产业链。

一款叫 " 写作狗 " 的系统,号称用 AI 技术对模板化句式做重组,可以将 AI 率从 95.77% 降至 11.3%。截至 6 月 10 日,该服务在淘宝已售出 4166 件,商家称 "90% 的用户降完后都是 10% 左右 "。

在社交平台上," 降手 " 们活跃起来。他们按字数收费,千字 10 元左右。主打 " 纯人工降 AI"。

《法治日报》的记者调查发现,人工只是号称,降手们靠的还是 AI。打开 AI 工具,输入特定指令," 操作快的话,10 多分钟就能改完 "。所谓的 " 降手 ",不过是会用 prompt 的中介。

传统论文代写需要人查资料、写文章,成本高、周期长;而降 AI 率的要低上很多,API 调用成本可能不到几毛钱,几分钟就能交货。也有学者认为,这门生意的利润空间,恐怕超过论文代写。

更值得注意的是,过去买代写的大多是少数不愿写论文的学生。但现在,大量自己认真写论文的学生,因为检测误判,也成了这门生意的被迫买单者。

媒体报道中,有人前后在维普做了 4 次 AIGC 检测、1 次查重,花了近 140 元,在同学中已属偏低。有人在知网反复检测降重花了约 750 元。

学生花钱检测,花钱降 AI 率,再把论文改烂。产业链的每一环都在赚钱,只有论文的质量在滑坡。

03 学术逆淘汰

过去几年,AI 生成的内容越来越多,人们对此的应对也在不断变化。

2023 年 1 月,OpenAI 发布 AI 文本检测工具 "AI Classifier",准确率仅 26%,同年 7 月宣布关闭。

2023 年,美国南佛罗里达大学邀请 72 名语言学专家区分 AI 文本和人类写作,正确率 39%。

2024 年初,福州大学、中国传媒大学等高校陆续发布毕业论文 AIGC 检测通知。

2025 年 5 月,南京大学明确:AIGC 检测结果仅作为学术规范性辅助参考,不作为论文原创性判定依据。

2026 年 5 月,中国学位与研究生教育学会发布《规范研究生学位论文与实践成果中人工智能工具使用指南》,重心从技术检测转向压实主体责任,强调使用声明、过程留痕和答辩质询。

这些反思和回调发生的同时,更多高校在加码。

有些学校已要求本科论文 AI 率不超过 15%,硕士不超过 10%,博士不超过 5%。福州大学规定:查重检测或 AIGC 检测第二次才通过的论文,最终总评成绩只能记作及格。

这意味着学生在跟一个误差高达 20% 的系统博弈。

江西师范大学政法学院颜三忠教授看来," 用 AI 检测 AI,再用 AI 改写欺骗检测 ",这已经构成了一个封闭的荒诞循环。

学生不是在学习如何做研究,而是在学习如何在一套不可靠的规则下生存。

学生为通过检测刻意 " 降 AI 率 ",本质上是被迫对抗技术缺陷,反而降低了论文质量。

上海财经大学特聘教授胡延平说得更尖锐:" 如果有毕业生用 AI 解决了某个重大问题,哪怕 AI 率高达 90%,也应该给他奖励。如果有人堆砌出了 AI 含量为零、但实际价值也为零的文章,即使给他发表空间也是资源浪费。"

几年前,OpenAI 已经因为检测准确率过低关闭了自己的检测工具,72 位语言学专家也分不清人和 AI。今天,AI 却有了决定学生能否毕业的权力。

这套系统里,一天卖出几千单的降 AI 服务,反而是问题最少的环节。

(文中人物皆为化名。)

相关标签

相关阅读

最新评论

没有更多评论了

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容