国思软件 - AI写小说的套路被扒光了： Claude爱平铺，GPT总做梦，Gemini只会“他如何如何”

　　先做个小测试。

　　读下面这段话：

　　“他感到胸口发紧，冷汗顺着脊背滑落，周围的灯光似乎暗了下来。空气中弥漫着一种说不清的气息，像雨后的泥土，又像某种古老的记忆。”

　　再读这段话：

　　“张三很害怕。他不知道为什么，但他就是觉得不对劲。他想起了小时候外婆讲的那个故事。”

　　直觉告诉你，哪段是 AI 写的？

　　大概率是第一段。因为你已经“进化”出了鉴别 AI 写作的雷达——那些过度描写感官体验、把“恐惧”包装成一堆生理反应的文字，怎么看怎么像 ChatGPT 的手笔。

　　过去一年，网上充斥着各种“AI 写作鉴别指南”：爱用破折号？AI 写的。爱用“首先、其次、最后”？AI 写的。形容词堆砌？AI 写的。但这些都属于“风格特征”——换一套提示词就能轻松绕过。很多人相信，只要会“调教”AI，就能让机器写出和人类别无二致的文字。

　　但马里兰大学和 Google DeepMind 的团队告诉你：别费劲了，AI 写故事的“底层操作系统”和人类完全不同，改提示词也救不了。

　　（论文地址：https://arxiv.org/abs/2604.03136）

　　一场“文学解剖”实验

　　2026 年 4 月，马里兰大学计算机系 Jenna Russell 团队联合 Google DeepMind 在 arXiv 上发表了论文《StoryScope: Investigating idiosyncrasies in AI fiction》（《故事显微镜：探究 AI 小说的特质》）。

　　5 月 28 日，沃顿商学院教授 Ethan Mollick 在X上分享了这篇论文，配文说：“关于 AI 写作风格特征（破折号之类的）已经写了很多，但这篇论文关注的是 AI 的叙事特征。AI 和人类叙事之间存在令人着迷的差异，而且让 AI 用不同风格写作，也几乎改变不了这一点。”

　　Ethan Mollick 于 2026 年 5 月 28 日在X上分享的论文核心图表，获得 31.5 万次查看

　　短短一天，这条推文获得 31.5 万次查看，3000 多个点赞，近 600 次转发。AI 圈的学者、写作者、普通读者都被同一个问题吸引了：AI 到底会不会讲故事？

　　实验的规模大得惊人：他们收集了 10272 个写作提示（相当于写作题目），每个提示分别由人类作者和五个大语言模型 Claude、DeepSeek、Gemini、GPT、Kimi 各写一篇故事，每篇约 5000 词。最终获得了 61608 篇故事，每篇提取 304 个叙事特征。

　　这是什么概念？相当于把六万多部小说的“骨架”一根根拆开，放在显微镜下比对，从情节结构、角色能动性、时间连贯性到对话密度，无所不包。

　　研究团队开发了一个名为 StoryScope 的自动化分析管道，能从 10 个维度自动归纳出细粒度的、可解释的叙事特征，涵盖情节、主体、时间结构等层面，然后对比 AI 生成的和人类写的，看看骨头架子到底有什么不同。

　　结果完全不看用词、句式、标点这些风格信号，仅用叙事特征，就能以 93.2% 的准确率区分人类和 AI 写作；在“六个作者分别是谁”的六类归属任务中，准确率达到 68.4%。作为对比，包含了风格线索的完整模型，准确率也就高出不到3%。

　　换句话说，AI 写作的“底层叙事逻辑”本身就是一张明牌。哪怕你把所有破折号都删掉、把所有“首先其次最后”换成口语化表达，你的叙事骨架依然会出卖你。

　　AI 写故事，到底哪里不对劲？

　　研究团队将核心差异归纳为五个维度。

　　AI 太爱“说教”了。AI 写的故事，就像一个生怕你读不懂的语文老师。77% 的情况下，AI 的叙事者会直接点明故事主题：“这个故事告诉我们……”，而人类作者的这一比例只有 52%。AI 故事里的对话出现哲学讨论的比例是 59%，而人类只有 34%。

　　更明显的是：AI 对其他作品的引用全是“模糊的暗指”（占比 72%），而人类作者更倾向于直接说“像《百年孤独》里那样”......明确提及作品名称占 50%。AI 的潜台词似乎是：“我告诉你一个道理，你好好听着。”人类的潜台词则是：“你自己品。”

　　你可能会说，这不是很负责任吗？把道理讲清楚不好吗？问题在于，好的故事从来不靠“讲道理”打动人。托尔斯泰不会在《安娜·卡列尼娜》结尾写“这个故事告诉我们，出轨没有好下场”——他让读者自己去感受。而 AI 做不到“放手”，它必须把每件事都说透。

　　人类会“跳时间线”，AI 只会一条道走到黑。人类讲故事喜欢玩花样：从葬礼开场，然后倒叙几十年前的事情，再突然闪回到现在。这种非线性叙事在 AI 那里几乎不存在。数据显示：79% 的 AI 故事“没有支线情节”，而人类故事的这个比例是 57%。AI 故事的主角驱动型结局占 69%，而人类只有 46%。

　　人类更喜欢让故事“悬着”，留给读者想象空间。人类故事的结局更偏向开放式模糊结局，让读者自己去琢磨“然后呢”。AI 则必须给每个角色一个交代：主角要么顿悟了，要么接受了现实（占 47%），而人类只有 27% 会这么做。

　　研究团队举了个生动的例子：让 AI 和人类分别写一个悬疑故事，人类可能从葬礼开场，再倒叙几十年前的恩怨；而 AI 会从第一条线索开始，按时间顺序一路推进到大结局，中间没有任何“岔路”。

　　AI 对“身体描写”上瘾。回到开头的测试。AI 写作最显著的特征之一：不会直接说情绪，而是用身体反应和环境描写来“演”情绪。

　　数据显示，81% 的情况下 AI 会通过生理感受和身体隐喻来传达情绪（人类只有 38%）。AI 使用嗅觉意象的比例高达 82%（人类 57%），还喜欢把环境设定作为角色内心状态的映射。人类作者写“张三害怕了”，就是一句话。

　　AI 写“害怕”：胸口发紧、冷汗直流、灯光变暗、空气中弥漫着某种气息……人类明确使用情绪标签（“感到害怕”“很愤怒”）的比例是 29%，而 AI 只有8%。这暴露了一个本质问题：AI 没有真正的情绪体验，它只能从训练数据中学习“情绪的外在表现”，然后用一种“教科书式”的方式把它们堆砌起来。

　　它知道恐惧会让人出汗，但它不知道出汗是什么感觉。所以它的描写总有一种“用力过猛”的违和感——就像一个人从没吃过柠檬，却要写柠檬的酸味。

　　人类会“打破第四面墙”，AI 只会闷头写。人类作者有一个 AI 学不会的绝活：和读者直接对话。“你，亲爱的读者，一定猜不到接下来发生了什么……”这种打破“第四面墙”的写法，28% 的人类作品会用到，AI 只有7%。

　　同时，人类写作提及具体文本和作者的比例几乎是 AI 的两倍（47% vs 24%）。人类能自如地在显性引用和隐性参考之间切换（37% 的人类作品是“混合模式”，AI 仅 16%），而 AI 只能躲在模糊的暗指背后，仿佛生怕暴露自己“没读过什么书”。

　　这绝不是因为 AI“没读过”，它的训练数据里什么书都有——而是因为它不知道什么时候该说“我在引用”，什么时候该保持沉默。换句话说，AI 的叙事是“没有读者意识”的叙事。它不在乎你在不在看，不在乎你能不能跟上，它只是在“完成任务”。

　　AI 的故事“撞脸”严重。AI 生成的故事在“叙事空间”中挤作一团，而人类的故事散落在四面八方。人类的故事素材库更丰富，涉及更多地点、对话占比更高、更多支线融入核心主题（42% vs 21%），也更常塑造存在道德矛盾的主角（59% vs 38%）。

　　人类的主角可以是好人也是坏人，可以既善良又自私；AI 的主角则倾向于“伟光正”。AI 的问题不是“写得不好”，而是“写得都一样”。它被困在一个狭窄的“默认叙事模板”，出不来。即便你给不同的 AI 模型同一个提示词，它们写出的故事在叙事空间中的位置也惊人地接近。

　　每个 AI 都有自己的“叙事指纹”

　　论文最有趣的发现来了：不同 AI 模型写故事的方式，就像不同作家的“笔迹”一样，各有各的毛病。

　　论文摘要中明确列出了三个模型的指纹特征——Claude 的事件升级格外平淡，GPT 过度使用梦境序列，Gemini 默认使用外部视角描述角色。基于论文实验数据的进一步分析推断，DeepSeek 和 Kimi 也呈现出各自鲜明的叙事倾向。

　　什么意思呢？如果你看到一篇小说里频繁出现“梦境的转折”，那八成是 GPT 写的；如果整个故事波澜不惊，情节推进像白开水，那大概率是 Claude 的手笔；如果每个角色都从外部描述，像在看人物档案卡，那 Gemini 跑不掉。更厉害的是，用这些“指纹”做六类归属（从五个 AI 模型和人类中识别具体作者），准确率高达 68.4%。

　　更扎心的是，论文还发现：所有 AI 模型生成的故事在叙事空间中聚集在同一个共享区域，而人类故事则散布在更广阔的空间里。

　　也就是说，不管你是 Claude 还是 GPT，不管你的“写作风格”如何调整，你们的“叙事 DNA”其实是一家人。这种“叙事趋同”现象，可能是大语言模型训练范式的某种固有问题——它们都从相似的语料中学习“什么是一个好故事”，然后得出了相似的结论。

　　“去 AI 味”还有意义吗？

　　这项研究的出现，恰逢“去 AI 味”成为热门话题。就在论文发布的同一个月，中文互联网上掀起了关于“豆包体”的群嘲——那些“最”“非常”“深深地”满天飞的 AI 生成文本，让网友笑到打鸣。各种“消除 AI 味的不完全手册”也应运而生。与此同时，尼日利亚作家纳齐尔的小说《林间之蛇》被指控存在大量“AI 写作痕迹”，文学界的 AI 写作争议愈演愈烈。

　　但 StoryScope 的结论泼了一盆冷水：改词汇、换句式、调标点，这些都是“表面功夫”。你让 AI 写“我很难过”而不是“一股悲伤涌上心头”，改变不了它的叙事结构。你把所有破折号都删掉，也改变不了它偏爱单线程叙事、回避道德模糊性的“底层代码”。

　　Ethan Mollick 在推文中特别强调：“要求 AI 用不同风格写作，也几乎改变不了叙事层面的这些差异。”

　　这其实触及了一个更深刻的问题：AI 到底能不能“像人类一样”创作？

　　从风格层面看，可以。提示词写得好，AI 能模仿海明威的简洁、博尔赫斯的迷宫、王小波的戏谑。但从叙事层面看，AI 在“怎么编故事”这件事上，和人类有着根本性的不同——它不经历生活，不理解死亡，不知道什么是“欲说还休”，所以它只能套用一个“标准的故事模板”。

　　这或许才是 AI 写作和人类写作之间，最难以跨越的鸿沟。

　　论文的结尾，研究团队抛出了一个值得深思的问题：随着 AI 生成文本越来越多地混入人类创作中，我们如何定义“原创性”？

　　他们公开了 StoryScope 的全部代码、10272 个写作提示，以及 51336 篇 AI 生成的叙事文本（部分提示因生成失败未纳入），供学术界进一步研究。这更像是一种“预警”——当 AI 生成的文字洪水般涌入文学市场时，我们需要一套能穿透表层、直达叙事底层的“照妖镜”。

　　而对于每一个用 AI 辅助写作的人来说，这篇论文或许也在提醒：别只想着“去 AI 味”，想想你到底想表达什么。因为 AI 可以帮你写出通顺的文字，但它永远无法替你经历一段人生——而后者，才是好故事的真正来源。（本文首发钛媒体 APP，作者 | 硅谷 Tech_news，编辑 | 焦燕）

AI写小说的套路被扒光了： Claude爱平铺，GPT总做梦，Gemini只会“他如何如何”

我们的产品

相关链接

关于我们

联系我们