用AI检测AIGC率,靠谱吗?

  文 | 霞光 AI 实验室,作者|朱峰琳,编辑|刘景丰

  6 月 23 日,Superhuman 宣布收购 AI 检测工具 GPTZero。

  这件事有意思在哪呢?

  收购方 Superhuman 是 Grammarly 的母公司,而 Grammarly,是全球最大的 AI 写作辅助工具之一,每天帮助 4000 万人把文章写得更通顺、更流畅。

  而被收购方 GPTZero,是一款拥有 1900 万用户的 AI 检测工具,专门去判断一篇文章到底是不是 AI 写的。

  也就是说,Superhuman 一边用 Grammarly 去鼓励 AI 写作,一边又用 GPTZero 检测是否是 AI 写作,来“反”AI 写作,这难道不是典型的左右脑互博吗?

  AI 检测 AI:一个无法自洽的“伪命题”

  用 AI 去检测 AI,这套逻辑从一开始就很拧巴。

  无论是 AI 生成还是 AI 检测,二者都是基于海量人类文本训练出来的模型,用的也是同一类技术路线:检测工具手里的那套人类写作标准,生成工具那里也有一套。而 AI 写作本来就是模仿人类写作,现在又要用 AI 检测工具去判断 AI 写的像不像人、人写的像不像 AI,本身就是一个悖论。

  而且,这里面存在着一个很致命的结构性问题:AI 检测可能永远跑不赢 AI 生成

  检测工具想要识别一款新模型的输出,需要拿到足够多的样本、标注数据、然后训练分类器。这个过程快则两三个月,慢则更久,但模型迭代的速度不会等人。例如,GPT-4 在 2023 年 3 月发布,同年 11 月 GPT-4 Turbo 亮相,间隔八个月。在这八个月里,Anthropic 发布了 Claude 2,Meta 推出了 Llama 2,各家模型接连更新,输出特征各不相同。等到检测工具终于完成训练、准备部署,新一代更强大的模型已经发布了。用上一代的数据去判断新一代的输出,准确率自然也会打折扣。 这种节奏问题,会让 AI 检测陷入“它跑它追,却无法追得上”的持续困境中。

  此外,这套逻辑中还有一个绕不开的问题:AI 幻觉。

  AI 写作会时不时产生幻觉,编造一些错误的或完全不存在的信息;而在检测 AI 过程中同样也会产生幻觉,形成误判,把人类写作标记为 AI 生成,或者把 AI 生成标记为人类写作。让一个会犯错的东西去审判另一个会犯错的东西,最终的后果却要人来承担,这也是 AI 检测 AI 的矛盾根源所在。

  现实情况也印证了这一点,而且比想象的更加离谱。

  有网友曾将 1776 年托马斯·杰斐逊写的《独立宣言》放入 AI 检测工具中,结果被系统判定为“99.99% 为 AI 生成”。一份写于 AI 诞生前两百多年的历史文献,在算法眼里就这样变成了机器产物。还有荣誉退休教授保罗·斯皮克四十五年前写的一篇论文,被某检测工具判定有 77% 的内容是 AI 生成的。

  这些作品诞生的时候,甚至大语言模型连概念都不存在。

  怎么会如此离谱?

  事实上,AI 检测器并不是理解文本的含义,它们关注的是文本的统计特征:词语序列的意外程度、句式长短和结构的变化幅度、词语搭配是否符合常见模式。越是用词精准、逻辑严密、句式规范的文字,越容易被判为 AI 写的;相反,语序混乱、用词生硬的内容,反倒更容易通过检测。

  当写得足够好反而成了被 AI 怀疑的理由,这已经不单单是技术缺陷的问题,而是这套逻辑本身就需要被重新审视。

  如何向 AI 证明“人类创作”

  除了 AI 检测工具自身的逻辑悖论,在全民拥抱 AI 的时代,用 AI 创作内容已被大多数人默认许可,现在又要用 AI 去检测内容中 AI 的比例,这便构成了另一层发展悖论。

  不过,悖论归悖论,要问 AI 检测工具是否有现实需求,答案无疑是肯定的。

  ChatGPT 发布之后,学生的课堂作业、毕业论文都开始受到 AI 的冲击,老师需要判断学生作业是否由 AI 代写,是否存在学术不端等问题。

  GPTZero 就是在这种情况下诞生的。2023 年初,受 ChatGPT 影响,学术造假情况逐渐增多,美国纽约市教育部甚至直接宣布禁用 ChatGPT 以保护学术诚信。发现这个教育痛点后,当时还在普林斯顿读大四的爱德华·田花几天时间写出了 GPTZero 原型,并将其发布至推特。他本以为只有几十个人会试,结果几小时内涌进两千多人,托管平台直接崩溃。三年后的今天,这个项目做到了3000 万美元年收入

  市场的需求,远比想象中更真实。

  但现实却在 AI 的演进中走向了另一个方向。

  理想的场景是:学生认真写完论文,AI 检测确认是“人写的”,然后提交给老师。

  现实的场景却是:学生写完论文,先过一遍 AI 检测——AI 率太高——把论文故意改差——再过一遍检测——AI 率降了——提交。

  论文写作不再是思考和表达,而是变成了一场与算法的猫鼠游戏。

  “真的被 AI 检测气笑了。”小红书上,一名今年写毕业论文的学生表示,快毕业那段时间,自己每天都陷入向 AI 证明自己的论文是人创作而不是 AI 的循环中。

  3 月-5 月,临近毕业这段时间,网上也陆续冒出了大量“降 AI 率教程”,逻辑和“降重”类似。有人建议,把 AI 生成的文本故意改得不通顺;有人建议批量删掉“首先”“综上所述”等开头的短句,因为这些结构容易被算法标记;还有人建议用翻译软件来回转换,输出的文本虽然可能不太流畅,但 AI 率能降下来。

3 月-5 月,小红书上出现大量论文 AI 检测、降 AI 率的帖子

  有学生无奈地感慨:“感觉改完之后,能过得了 AI 检测,但过不了导师那一关。”

  事实上,当学生把大量时间花在“降 AI 率”上,论文的写作价值就已经被掏空了。写作能力养成的核心环节,从反复打磨、锤炼表达,变成了摸索算法偏好、制造人工痕迹

  不仅如此,就连那些没有使用过 AI 的学生,也未能在这场猫鼠游戏中全身而退。

  加州大学戴维斯分校的学生威廉·夸特曼就曾遇到过类似的“AI 检测乌龙”事件。2023 年,夸特曼在一次历史考试中被教授怀疑用 ChatGPT 作弊,其论文也被 GPTZero 检测为“很可能由 AI 生成”。教授据也因此给了他不及格,并将其移交至学校的学术诚信调查部门。为了自证清白,夸特曼向校方提供了 Google Docs 的编辑历史,包括文档的逐字修改记录、打字的时间线等操作痕迹,这才被学校撤销了指控。

  一旦 AI 检测失误,将没有用 AI 的内容标记成 AI,人们就要陷入无休止的自证。AI 本应服务于人,现在却反过来要求人向技术证明自己的可信度。

  矛盾中的市场刚需

  AI 发展到现阶段,一个不得不承认的事实是,尽管 AI 检测赛道充满着矛盾和悖论,但相关产品不仅不会消失,还会越来越多,市场也将会持续扩张。

  2026 年 1 月,《2026 AI Detection Landscape Report》给出了一组数字:全球 AI 内容检测平台从 2024 年的约 85 个增长到 2026 年的 247 个,两年增长了 190%,文本检测的平均准确率也从 90.1% 爬升到了 94.3%

  这些 AI 检测工具也不再只是老师抓作弊的帮手,而是不断进化,进入到了更多原本意想不到的地方。

  2026 年 1 月,Originality.ai 发布了专为 STEM 学科设计的 Academic Model,用于检测包含代码和公式的学术作业。6 月,公司又发布了 Moodle 插件,让教育机构能将其 AI 检测和查重功能无缝集成到教学管理系统中。

  此前专注于文本检测和查重的 Copyleaks,也在今年 6 月份也进入了 AI 检测赛道,推出了一款企业级 AI 视频检测工具,能够对视频文件的视觉和音频轨道进行同时扫描,精准识别 AI 生成内容出现的具体时刻。

  教育场景只是起点,但远不是终点。这些产品迭代的背后,还有一道更深的推力在发挥作用——AI 合规

  随着 AI 生成内容越来越逼真,效率提升的另一面,是风险的同步增长。近两年,利用 AI 换脸和语音克隆实施的诈骗案件明显增多,福建一位企业负责人被伪造的“好友”视频骗走 430 万元,全国政协委员靳东在今年两会期间也披露,有老人因 AI 伪造的人脸和声音被骗走 27 万元养老钱。

  诈骗的蔓延加速了监管落地。2025 年 3 月,《人工智能生成合成内容标识办法》发布,要求所有 AI 生成的文本、图片、音频、视频添加显式和隐式标识。2026 年 6 月,短视频平台全面上线 AI 生成内容标注标签,未标注的内容不予分发。国际市场上,美国联邦贸易委员会目前已依据《TAKE IT DOWN Act》对 AI 深度伪造内容进行执法,欧盟《人工智能法案》第 50 条关于 AI 标识的透明度义务也将于 2026 年 8 月 2 日生效。

  而这还仅仅只是开始,未来的合规监管一定会更具体、更严格——哪些场景必须标注、哪些场景禁止使用 AI 生成、平台承担多大的审核责任,都将会有更明确的规定。当这些规定逐步落地,AI 检测就不再只是学校的工具,而是内容平台、媒体机构、广告公司、金融机构等各行各业都离不开的基础设施。银行需要确认客服电话那头是真人还是克隆语音,新闻媒体需要核实一段现场视频有没有被 AI 篡改,招聘平台需要验证求职者的视频介绍是不是本人拍摄的。

  一边鼓励用 AI 提效,一边检查哪些东西用了 AI。AI 检测这件事,看似和拥抱 AI 的大趋势背道而驰,但实际上并非是传统意义上的倒退。当一个技术能以假乱真的时候,区分真假就是对更多人负责。学生可以用 AI 辅助学习,但论文需要证明是自己写的,这关乎教育公平。企业可以用 AI 生成营销素材,但产品宣传视频不能靠捏造不存在的功能欺骗消费者。普通人刷短视频时,更有权知道屏幕里的内容是否是真实存在的。

  AI 生成的内容越多,真假就越难分辨,AI 检测工具的角色也就越清晰:它不是在限制 AI 发展,而是在为这个快速膨胀的世界标出必要的边界。边界之内,AI 可以自由生长;边界之外,有些东西必须属于人类。看似矛盾,实则是技术演进到一定阶段必然会出现的制衡。

  这个世界已经离不开 AI,也更离不开能分辨 AI 的人。这也是为什么一个充满矛盾的赛道,会越走越宽。