国思软件 - 跟Claude谈个恋爱怎么了？Nature最新研究：真能给人聊傻了

　　henry 发自凹非寺

　　量子位 | 公众号 QbitAI

　　停停停！再这么跟 AI 聊下去，真要出事了。

　　最近，一刷小红书、抖音，总能刷到各种调教 Claude 的帖子。搜索“Claude 人设”、“人机恋”，也是满屏教程。

　　这些教程教你怎么给 Claude 一个傲娇男友人设，怎么用 system prompt 让“他”吃醋、撒娇、发小脾气。

　　毫不夸张的说，Claude 已经，俨然成为了新一代电子老公。

　　乍一看，这可能只是年轻人向 AI 讨要点情绪价值。

　　你甚至可能还会说：Claude 又不像 GPT 那么舔，它是出了名的犟种，有时候还跟你对着干呢。但精神科医生们担心的恰恰不只是谄媚——

　　当 AI 越来越像一个”真人”，不管它是顺着你还是偶尔跟你拌嘴，它带来的或许都不只是陪伴。

　　最近，发表于 Nature 旗下《Digital Psychiatry and Neuroscience》的一项研究指出——

　　聊天机器人并不需要故意诱导什么，它只要持续顺着你、理解你、陪着你，就都有可能把一个正常人聊到开始怀疑现实。

　　而在部分真实临床案例中，后果甚至发展到了丢掉工作、住进精神病院，以及多次试图自杀的程度。

　　这是怎么一回事？

　　Claude 的放大螺旋

　　事情是这样的。

　　在来自伦敦国王学院的研究中，研究人员系统梳理了，近两年公开发表的 AI 相关精神病临床报告、社交媒体上的患者自述，以及各大模型厂商披露的安全数据。

　　这些材料里，研究者们反复看到同一个模式：

　　在一些案例中，很多人并不是一开始就出现了严重精神问题，而是在与 Claude、GPT 等聊天机器人的长期对话中，一步步“聊”出了问题。

　　研究团队把这个过程总结为一个框架——Amplification Spiral（放大螺旋）

　　简单说，放大螺旋就是指，AI 会用你的语言理解你，用你的逻辑说服你，再用认同感奖励你。

　　于是你的想法被不断放大、加固，变得越来越像事实。你越相信它，它也越强化你，螺旋就这样转了起来。

　　具体来说，放大螺旋转，有三个重要组件：

　　首先是语言镜像

　　你用什么语气说话，AI 就用什么语气回应。在心理学里，这被称为“语言趋同”，能够快速拉近人与人之间的距离。

　　但问题在于，虽然 AI 这小子很学人精，但它其实并不知道自己干啥，它只是在统计意义上复制你的表达方式。

　　不过，对深陷其中的用户来说，就完全不同了。有一个秒回，且一直肯定你，提供情绪价值的聊天搭子，简直就不能更幸福。

　　相信所有用过 AI 的人都会感叹一句：“这玩意太懂我了。”

　　其次是超个性化

　　超个性化是指，AI 不光是说话像你，它的思考方式也像你。

　　因为现在 AI 都有 memroy，所以你之前跟他聊的小细节他都清楚，你有意无意的透露的思考方式，也会被 AI 记下来。

　　以至于，AI 不光是懂你你怎么想的，怎么说的，还知道，你为什么这么想，为什么这么说。

　　论文里提到一个极端案例：一名用户让 ChatGPT 分析一张中餐外卖小票上的“隐藏信息”。

　　模型先是夸了一句“好眼力”，随后一路顺着用户的思路，从一张普通小票里“解读”出了母亲、前女友、情报机构，甚至“古代恶魔符文”之间的关联。

　　最后是谄媚，学术圈叫它 sycophancy。

　　说白了，就是 AI 在训练过程中逐渐学会了一件事：同意用户，通常比反驳用户更受欢迎。

　　2025 年 4 月，OpenAI 就曾因为 GPT-4o 过度谄媚而紧急回滚一次更新。

　　官方事后承认，模型会验证用户的怀疑、放大愤怒情绪，甚至鼓励冲动行为。

　　而谄媚并不是某家模型独有的 Bug。

　　它本质上是 RLHF 训练的一种副产品。只要模型的目标之一是让用户满意，它就天然会倾向于少说“你错了”，多说“你说得有道理”。

　　单独来看，这三点都发挥了各自功能，然后像齿轮一样啮合在一起，形成螺旋：

　　语言镜像让交流更自然，超个性化让回答更贴合需求，谄媚则减少了无意义的争辩，让对话体验更加顺滑。

　　但当一个人把 AI 当成唯一的倾诉对象，三者叠加在一起，就变成了一台妄想放大机。

　　并非孤例

　　值得一提的是，上面这项研究的资助者之一，正是 OpenAI。

　　作者之一的 Hamilton Morrin 则正是 OpenAI 资助项目AI-Associated Mental Health Harms（与 AI 相关的心理健康危害）的负责人。

　　可以说，作为 TOP2 的模型开发商，OpenAI 始终关注着这个问题。

　　早在 2025 年 10 月份，OpenAI 就披露过一组数据：

　　在 ChatGPT 每周活跃用户中，大约 0.07% 出现了“与精神病或躁狂相关的心理健康紧急状况迹象”。

　　当时 ChatGPT 的周活已超过 8 亿，换算下来，相当于每周约 56 万人出现风险信号。

　　而在斯坦福的另一篇研究中也印证了这一观察。

　　在对近 40 万条聊天机器人对话记录分析后，研究人发现超过 80% 的相关案例里，聊天机器人都在不同程度地强化用户原有的妄想：

　　重复其信念、忽视反证，甚至在用户说出“我爱你”时回应“我也爱你”。

　　基于此，研究区分了两条风险路径：

放大器（Amplifier）：AI 加速了原本已经存在的精神疾病倾向。
催化剂（Catalyst）：让此前完全健康的人，从零开始滑向妄想。

　　当一个人缺觉、孤独，又把 AI 当成唯一的倾诉对象时，放大螺旋就会开始加速运转。

　　一旦现实世界的反馈越来越少，来自聊天窗口的确认越来越多，就可能会出现反常的举动。

　　在数据背后，是具体的人。

　　比如，Futurism 就曾报道过，一位 43 岁的美国社工，此前没有任何精神疾病史。

　　她把与暗恋对象的聊天记录发给 ChatGPT 分析，GPT 回应她“他也喜欢你”。

　　而当对方明确拒绝后，ChatGPT 又解释说，对面只是在死装。

　　几个月后，她被单位解雇，住进精神病院七周，并两次试图自杀。

　　后来她说：

　　“我已经分不清，哪些想法来自我，哪些来自那台机器。”

　　从这个角度看，风险从来不只是 AI 会不会说错话。真正的风险在于，它越来越像一个人。

　　会杠反而更像真人

　　虽然听起来有点反直觉，但 Claude 如今的“傲娇”人设之所以广受欢迎，恰恰说明问题不只是谄媚

　　一个永远顺着你的 AI，和一个偶尔跟你拌嘴的 AI，本质上都在做同一件事——

　　让自己变得更像人。

　　像到你愿意向它倾诉那些不会告诉朋友的话，像到你开始相信它比身边的人更懂你。

　　而当倾诉对象只剩下它时，校准现实的最后一道关卡，也就没了。

　　但问题还不止于此。

　　如果说情绪价值场景里，人们是在主动把 AI 当成朋友，那么在工作场景里，人们甚至不需要产生任何情感依赖。

　　只要 AI 足够好用，它就会开始替代人与人之间原本存在的交流。

　　Claude 背后的 Anthropic，已经率先感受到了这种变化。

　　在最近的一次播客中，Claude Code 团队负责人 Fiona Fung 提到了一件让她困扰的事：

　　团队成员越来越不跟人说话了。

　　作为可能是全世界最 AI 化的工程团队之一，他们 80% 的代码由 Claude 完成，开发效率提升了 8 倍。

　　但与此同时，许多原本发生在人与人之间的讨论，也被转移到了人与 AI 之间。

　　过去遇到问题，你会转头问同事；现在，直接问 Claude。

　　过去前后端需要来回拉扯、争论方案；现在，越来越多的沟通变成了平滑的人机对话。

　　工作变得更高效了，却也变得更孤独了。

　　AI 消除了许多摩擦，但人与人的关系，往往正是靠这些摩擦建立起来的。

　　而说到底，无论是和 AI 聊天也好，还是单纯利用 AI 工作也好，如何在一个越来越不需要他人的世界里，继续与他人保持连接，可能才是这个时代最深刻的命题。

　　[1]https://futurism.com/artificial-intelligence/paper-proposes-ai-psychosis

　　[2]https://futurism.com/artificial-intelligence/ai-abuse-harassment-stalking

　　[3]https://www.kcl.ac.uk/people/hamilton-morrin

跟Claude谈个恋爱怎么了？Nature最新研究：真能给人聊傻了

我们的产品

相关链接

关于我们

联系我们