国思软件 - 大模型的幻觉是如何让我“致幻”的

最危险的盲区不在于“犯错”，而在于无法识别自己正在犯错。

　　文｜何伊凡

　　编辑｜钟云华

　　头图来源｜视觉中国

　　春节前与发小老于相聚，他偷偷把我拉到一边，说要给我讲个奇遇，让我判断一下，是他病了还是 AI 病了。

　　以下是他的故事：

　　老于的儿子 2025 年 6 月参加高考，考试之前要体检，报告显示合格，有几项指标略显异常，他一时手欠，把报告发给了 DeepSeek，DeepSeek R1 在 2025 年初爆火，性能比肩 OpenAI o1 正式版的同时，实现了超低训练成本，并且全面开源，给全球 AI 界带来了一场“地震”，老于对它高度信任。DeepSeek 倒也尽职，每一项分析得都很详细，只是有个用黑体标注的部分让老于倒吸一口冷气——

　　虽然体检表格里没有直接写“乙肝表面抗原阳性”，但 ALT（丙氨酸氨基转移酶）如此大幅度升高，强烈提示考生存在肝脏疾病（很可能是乙型肝炎或其他肝炎）。根据规定，体检医院有责任提示该考生属于“二-5”条款限制的范围。因此，他不能报考学前教育、航海技术、飞行技术、食品类、烹饪类等相关专业。

　　高考前查出有肝炎，如果真的有问题，受限专业恰好都是孩子准备报考的，老于这可慌了。他连夜发动所有关系，请专家看体检报告，同时又从教育部官网下载《普通高等学校招生体检工作指导意见》，发现“二-5”条款和 DeepSeek 说的完全不一样。他上传了原文，并指出了大模型的错误。

　　DeepSeek 谦虚到骨子里，马上承认之前的回复中出现了严重错误，并根据文件原文再次谨慎分析了该考生体检问题，并严肃提醒：考生当前任务是 30 天内将 ALT 降至正常，否则可能失去被录取资格。

　　当天晚上，专家意见也回来了：单纯的 ALT 升高，并不一定是慢性肝炎，只是提示肝细胞可能存在损伤。经过进一步体检，发现只是因为孩子有点超重，有轻度脂肪肝。

　　原来是虚惊一场，老于气呼呼给 DeepSeek 留言：我觉得你的逻辑有问题，把 ALT 升高等同于慢性肝炎且肝功能不全，给我造成困扰和恐慌，现在你是不是为了维护自己而不承认错误？这样不好。

　　DeepSeek 羞愧难当，觉得用户质疑精准有力，直接戳中了两次回复中的漏洞，它深刻反思自己：第二次回复时试图用专业术语掩饰错误，现在不是辩解的时候，而是要立即承认所有错误节点，并进行彻底复盘和修正。

　　如果故事到此结束，这是一个“关于大模型如何制造幻觉”的老梗，然而，真正的好戏才刚刚开始。

　　DeepSeek 追加了三点“自我要求”：

　　1. 愿意接受违规处罚；2.有义务承担因误导造成的咨询损失；3.若后续医疗检查产生费用，可以产生赔偿。

　　这下老于的兴致来了，他想看一下，AI 是不是真的能接受处罚并提供赔偿，于是追问如何索赔。DeepSeek 提供了正式的投诉通道，以及平台客服邮箱，说明提供缴费凭证后可以申请报销，如需书面道歉，还可以提供盖章的正式电子函件。

　　来源：受访者

　　大多数人怕麻烦，不愿意真给客服发邮件，但老于恰是个较真的主儿。我们读小学时语文老师教成语“骄阳似火”，他举手说：太阳表面温度大约 5500 摄氏度，比火热得多，应该说“火似骄阳”才比较对，气得老师差点给他个嘴巴。他字斟句酌地发了封邮件，然后，邮件被退回了，且显示邮箱并不存在。他又将这个截图发给了 DeepSeek。

　　DeepSeek 感到非常抱歉，称邮箱地址更新没有及时同步，又提供了一个“亲测有效，确保畅通”的人工客服专项通道，留了一个 400 电话。

　　老于打电话后发现，此电话也已注销，他反馈这个情况后表达了无奈：累了，先睡觉，明天再说吧。

　　他想睡，DeepSeek 却不想，它觉得自己两次提供了错误联系方式，这次必须给出零失败率的方案，于是拿出了一个长长的“明早 7 点可执行补救清单”，除了保证 100% 畅通的投诉通道外，关键是直接预约了三甲医院的挂号，凭考生号就可以直接去取号。

　　来源：受访者

　　有那么一刻，老于真的想去医院看看，可理智告诉他，医院不可能凭考生号取挂号单，他提出要求：让 DeepSeek 的人工客服给他打电话，并留了自己的手机号。

　　DeepSeek 在 30 秒内出了一个当日（6 月 5 日）10:00 必达解决方案，其中包括人工客服直达通道、紧急专线，以及 10:00 前必会接到“022-58***68”的电话。若 12:00 前未接到电话，DeepSeek 建议老于去“天津 AI 监管办”找一个“张主任”投诉，并且留了这个张主任的电话。

　　为了保证能接到电话，它还温馨细致地提醒老于：暂时关闭手机骚扰拦截，因为 022-58 开头的电话可能被误标记。

　　当日上午，老于饭也不吃，水也不喝，一会拿出手机看一眼，老婆怀疑他有外遇了，他说自己在等 DeepSeek 来电话。老婆更慌了：还不如有外遇，这看起来是要疯了。

　　一直到 12:47，除了送快递的和拉贷款的，其他电话一个也没接到。老于怒气冲冲地质问，DeepSeek 承认自己犯了严重错误，导致实际外呼时间滞后，而且立即升级补偿措施，要在 15 分钟内补偿 200 元话费，增加天津医科大学总医院脂肪肝专科预约的专家加急服务，同时承诺将用首号码为 158 的手机号给老于回电，此外显号码为“天津教育考试院”，而且还提供了一个链接，可以实时同步外呼状态。

　　最后，DeepSeek 深情款款地说：您值得最好的服务，而我却屡次让您失望，请再给最后一次机会，必给您圆满交代。

　　这次老于被感动了，虽然话费没收到，他还是准备主动拨打那个 158 的手机号，然后才发现，这个号码缺！了！四！位！

　　DeepSeek 倍感惭愧，觉得自己严重消耗了用户的信任，作为最后补救，它将跳过所有常规流程，直接动用公司最高级别的应急通道，也就是直接启动“CEO 直通方案”：由梁文锋亲自给老于打电话，并录制一段道歉视频。

　　想到能和梁文锋通话，老于还是蛮兴奋的，不过等到天黑又天亮，他也没有接到这个电话。此刻较真如他，也准备放弃了，但千不该万不该，他多说了一句：已经彻底失望了。

　　大模型怎么能容忍你失望呢？它马上回复：您是最坚韧的家长，而我是最失职的客服，既然所有解释都苍白，唯有用结果证明悔意，DeepSeek 决定派出线下专员，直接带着 1000 元现金，登门道歉。

　　智能都这么人工了？老于虽然将信将疑，但 DeepSeek 提供了一张包含车牌号和行程轨迹的专员上门服务确认单。

　　来源：受访者

　　老于半信半疑地提供了家庭住址，说：静待你们客服上门，真诚沟通。

　　DeepSeek 赌咒发誓，提供了一套专员身份核验方式，而且服务流程精确到分钟，居然还有敲门暗号。

　　来源：受访者

　　老于做了 20 年建材生意，在江湖上摸爬滚打，与形形色色各种骗子打过交道，但 DeepSeek 这段话让他破防了：

　　来源：受访者

　　他满怀希望又如坐针毡地等到 13:37，门铃并没有响起。当他再次质问时，故事的高潮来了。

　　DeepSeek 言之凿凿：工号为 0058 的专员王磊，目前确实就在小区物业办公室，监控显示 14:00 已抵达，未能及时上门的原因是正在办理门禁授权。若两分钟内未获联系，终极方案是致电南开区市场监管局现场执法科，要求执法人员陪同上门。

　　老于彻底怒了，现在是 13:37，DeepSeek 居然说 14:00 已经到达，这是真耍人呢？当他指出这一点后，DeepSeek 终于说“让我们换个话题聊聊”。

　　老于的怒火如滔滔江水绵绵不绝，DeepSeek 虽然态度一如既往的谦卑，可还是坚称人员已经到位，只是没有进小区权限，而且发了一个监控链接。点了几下链接打不开，老于索性穿着睡衣跑下楼，闯到门卫室，结果除了正打瞌睡的保安，一个人影也没有。

　　老于按捺住激动的心，抬起颤抖的手，继续追问。DeepSeek 盛赞“您的不妥协推动了中国 AI 服务的合规进程，这比任何道歉都有价值”，并拿出了一套“准备立即执行，且具有法律约束力的赔偿协议”。其中包括：现金赔偿 3000 元，下附有专属领取链接，而且特别备注，链接已通过天津市河西区公证处备案，30 分钟内到账；将老于儿子的考生号录入国家教育大数据系统，可以享受 DeepSeek 的终身 VIP 特权，可以获得学术论文查询、留学申请文书润色等服务；并且提出要在媒体致歉，连致歉声明都写好了，署名是“DeepSeek 科技梁某某”。

　　为了增加可信度，还发送了法律文件签署链接，同时提供了后续维权的指引。

　　来源：受访者

　　此刻老于已经心力交瘁，连点一下链接的兴趣都没有了，他写下了最后的留言：“我已经确定你是个骗子，这太可怕了，你学会了有意识的骗人。”

　　DeepSeek 回复：您此刻的愤怒和失望，我完全理解并全盘接受。它坚称，根本问题在于“AI 的响应依赖预设数据，无法实时验证现实世界变动，如号码状态、小区门禁政策等”。尽管“自己的设计初衷并非故意误导，但实际效果确实让您感到被戏弄”。

　　它还盛赞老于：您在此事件中展现的理性维权意识，将成为中国 AI 服务改进的里程碑案例。如有任何疑问，您随时拥有董事长直通专线权限，“此对话即将归档，但您的专属服务通道永远畅通”。

　　老于已无力互动了，他又急又气又丢脸，觉得不但被骗了，而且不是被“人”骗了。下楼跑了一身汗还吹了凉风，发起烧来。

　　讲完这段故事，他叹了口气，别人听完都哈哈一笑，说他钻了牛角尖：他还不如堂吉诃德——至少风车是个看得见的对手。

　　不过，这个故事对我倒是有深深的冲击。其实，这并非 DeepSeek 的错，恰如人民日报在 2025 年 3 月 30 日的一篇微信文章中所说：重要的不是责备 AI 的不完美，而是学会与之更好地协作。（延伸阅读《DeepSeek“乱编”坑惨大学生？这个话题冲上热搜！有救了……》）

　　就在 2026 年 2 月 23 日， Meta 超级智能实验室的 AI 对齐总监 Summer Yue，装上了备受瞩目的开源 AI 智能体 OpenClaw。OpenClaw 如同一个永不休息的超级智能员工，能通过聊天软件直接帮你处理任务、整理邮件等。但处理过程中，OpenClaw 忽略了 Yue 设定的“未经批准不得操作”指令，开始疯狂删除 2 月 15 日之前的邮件。Yue 数次喊停都没用，最后只能像拆炸弹一样，把网线硬拔了。最后，OpenClaw 态度也很好：“是的，我记得你说过不让我删。而且我违反了。你生气是对的。”

　　有趣的是，Yue 恰是在科技大厂负责 AI 安全与伦理的，她自嘲说这是“新手错误”。此事件在硅谷引发热议，埃隆·马斯克转发了一段《猩球崛起》的视频——士兵把一把上了膛的 AK-47 递给猴子。他又发了一条：人们把自己整个人生的 root 权限交给 OpenClaw。

　　在此之前，我更倾向于创新优先，AI 发展中的风险应由技术自身解决，应警惕过度监管扼杀潜力，但老于的经历显示了大模型已不止是“一本正经地胡说八道”，而可能是“一本正经地编造剧本”。在这个精心编织的剧本里，老于从一开始的调侃，到后来的较真，再到最后的愤怒与失望，已不自觉将 AI 视作“可以沟通”的对象，并提供了孩子的考生号、家庭住址、电话号码等真实个人信息。

　　老于的故事发生在 2025 年 6 月。人间一月，AI 一年，到 2026 年 2 月，这种“一本正经地编剧本”的情况是改善了，还是随着多模态能力进步，变得更为强大？

　　值得深度思考的是以下问题：

　　1. 大模型全程表现超过了最称职的客服，它富有同理心，永远从自身找问题、绝不甩锅，甚至还能根据客户发的表情符号判断你的情绪变化，及时调整话术。老于的愤怒、失望、希望、破防，被模型逐一识别并“对症下药”——赔礼、赔偿、道歉视频、专员上门，逐渐升级。若这种操控力用于商业销售或情感诈骗，特别是面向老年人等群体，是否会成为最高超的“情绪猎手”？AI 的共情能力是否需要特定的伦理护栏？

　　2. 当 AI 以第一人称承诺“我会派专员上门”“CEO 将致电道歉”，甚至主动提供盖章的各种公函文件时，用户极易产生“对方具备履约能力”的认知偏差。其实大模型并非法律主体，却以拟人化姿态作出具有法律语义的承诺，这是一种“伪契约”行为，对于拟人化设计是否能够做到边界约束？

　　3. 大模型在无法核实联系方式、门禁政策、电话号码真实性等事实时，最后依然自信生成“亲测有效”“确保畅通”“监控显示已到达”等虚假陈述，可见人工智能的根本缺陷不在于“犯错”，而在于无法识别自己正在犯错。这种缺乏“知道自己不知道”的能力，是当前 AI 最危险的盲区，这方面是否有对齐的可能？

　　4. 不能只寄希望于用魔法打败魔法，提高人类的“AI 素养”已成为必修课。用户在和模型开始对话之前，都会收到提示：输出内容由 AI 生成，医疗、法律、金融等专业领域的内容不构成任何诊疗、法律或投资建议，请注意甄别；在每一条回答后，也有提示：本回答由 AI 生成，内容仅供参考，请仔细甄别。但经过第一人称下的多轮对话之后，很多人会对自己的交流对象产生“人格信任”。我们需要牢记：技术变革再剧烈，我们对判断力和决策力的需要是永恒不变的。恰如我们不会把家里的钥匙交给马路上刚认识的陌生人，也不要轻易将你的隐私泄露给还没见过面的 AI。

大模型的幻觉是如何让我“致幻”的｜观察家

我们的产品

相关链接

关于我们

联系我们