国思软件 - 实锤！GPT-5.5「降智」被抓，OpenAI官方文档认了

　　新智元报道

　　GPT-5.5 被扒出「假思考」，用两小时就被偷偷换成 mini，200 美元月费买了个「薛定谔的脑子」。Trace 命令实锤，官方文档亲自认领。往后有纷纷吐槽：OpenAI，你糊弄谁呢？

　　ChatGPT 又被爆「降智」了！

　　就在这两天，上率先炸锅。

　　网友 Lisan al Gaib 发现，GPT-5.5 用了一两个小时后突然变傻，每个请求都是秒回，质量断崖式下跌。

　　但界面上显示的，依然还是「GPT-5.5 Extended Thinking」。

　　也就是说，思考的标签还挂着，但思考本身已经消失了。

　　200 美元/月，买了个「薛定谔的模型」

　　OpenAI 开发者论坛上，一篇投诉帖同步爆了。

　　Agentify.sh 表示，GPT-5.5 用着用着会突然丧失遵循指令的能力。

　　眼瞧着它兴冲冲地宣布「修好了」，结果代码质量差到引发大面积回退。

　　之前 5.5-med 就能轻松搞定的 UI 任务，现在连最简单的改动都搞不定。

　　升到 5.5-high，没用。再升到 xhigh，还是不行。

　　而且 xhigh 以前能跑好几个小时，现在明显缩短了。

　　帖子一出，回复区瞬间炸了。

　　有人直接退回了 5.4。

　　有人用的是 xhigh 最高档，但「跟上周比明显拉胯，长任务频繁出错，完全不遵循工作流」。

　　有人反映更离谱的情况，「简单查询也要转很久，你打断它纠正方向，它直接无视你，继续按之前错误的计划走」。

　　没错，所有人都在描述同一个现象——GPT 的脑子，不知道什么时候被偷偷换掉了。

　　GPT-5.5 目前的表现跟 5.3 差不多，毫不夸张。头几天还惊艳得不行，现在完全找不到当初那个模型的影子了。

　　不是错觉，OpenAI 自己白纸黑字写着

　　为了验证，Lisan al Gaib 专门做了一个对比测试。

　　同一个账号，ChatGPT 端用 Extended Thinking 跑出来的全是垃圾，转头到 Codex 端用 xhigh，立刻恢复正常。

　　用他的原话说就是，Codex「简直比这玩意儿聪明 40 亿倍」。

　　开发者 Andrew Curran 则想了个妙招——直接问模型「你的训练数据截止日期是什么？」

　　模型回答，August 2025。

　　问题是，GPT-5.5 Thinking 的截止日期是 12 月。8 月，是 Instant 版本的截止日期！

　　也就是说，他选的是 Thinking，系统实际给他跑的是 Instant。

　　界面上模型标签一个字都没变，但背后的模型已经被偷偷换掉了……

　　搞笑的是，这次 OpenAI 竟然在自己的帮助文档里替用户做了实锤。

　　根据 OpenAI Help Center 的官方说明，Plus 用户每 3 小时最多发送 160 条 GPT-5.5 消息。

　　用完之后，系统会静默切换到 mini 模型，直到额度重置。

　　注意「静默」两个字。

　　没有弹窗提示，没有模型标签变化，没有任何视觉反馈。

　　你还以为自己在用旗舰模型，对面已经悄悄换成了 mini。

　　Pro 用户也别高兴太早。

　　Heavy 思考模式，那个 Pro 独享的最高推理档位，在服务器负载高的时候，同样会被容量限流。同样没有预警。

　　换句话说，200 美元/月的 Pro 订阅，买到的是一个随时可能被「偷梁换柱」的服务。

　　而这种「标签没变，脑子换了」的操作，在 Codex 端更早就被人抓包了。

　　今年 2 月，GitHub 上出现了一个 issue，一个 Pro 用户用 trace 命令抓到，自己请求的是 GPT-5.3 Codex，实际返回的模型是 GPT-5.2。

　　连 5.2 Codex 都不是，是更低的基础版 5.2。

　　他贴出了复现命令：

RUST_LOG='codex_api::sse::responses=trace' codex exec 
--skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o 
--replace '$1' '"model":"([^"]+)"' | head -n1

　　输出：gpt-5.2-2025-12-11

　　预期：gpt-5.3-codex

　　多个 Pro 用户在同一个 issue 下确认了同样的降级。

　　而且这种降级是「粘性的」，不会自己恢复，也没有任何解释。

　　甚至，在 4 月 GPT-5.5 发布当天，还有用户报告 Fast 模式的速度跟 Standard 差不多，但计费还是按 Fast 来的。

　　简单任务跑了 7 分 49 秒，正常应该5-6 分钟。

　　OpenAI 承认了，然后就没有然后了

　　5 月 15 日，OpenAI 的 status 页面出现了一条记录。

　　GPT5.5 Performance Degradation，我们正在调查部分用户反映的 GPT-5.5 性能下降问题。

　　5 月 17 日，状态更新为「已解决」。

　　但从论坛帖子的时间线来看，5 月 24-26 日的降智投诉比 5 月 15 日那波更猛。

　　要么「解决」了的问题又回来了，要么压根就没真正解决。

　　每次升级都是一次「降智争议」

　　虽然各家都会遇到「模型变蠢」的吐槽，但 OpenAI 从 GPT-5 到 GPT-5.5 的每个更新，一次都没缺席。

　　每一次 OpenAI 都说在调查，每一次都说已解决，然后下一个版本继续。

　　2025 年 8 月，GPT-5 首发。Reddit 的热帖标题直接就是「GPT-5 太烂了」。用户投诉短回复、更多拒绝、更少人格感。

　　OpenAI 被迫紧急恢复 GPT-4o 选项。奥特曼在 Reddit AMA 上亲自承认「比我们预期的颠簸」。

　　2025 年 12 月，GPT-5.2。翻译质量倒退，编造不存在的 API，拒绝执行 5.1 能轻松完成的风格指令。

　　2026 年 2 月，GPT-5.3-Codex。Pro 用户被静默降级到 5.2，trace 命令实锤。

　　2026 年 3 月，GPT-5.4。OpenAI 社区论坛出现「GPT-5.4 在 Codex 里明显退化了」帖子，网友回复全部确认。

　　2026 年 5 月初，GPT-5.5 Instant 上线。回复长度缩短 30%，emoji 几乎消失。网友总结：精度提升了，但温度消失了。

　　2026 年 5 月下旬，也就是现在。Thinking 模式的降智投诉再次爆发。

　　Lisan al Gaib 透露，自从 GPT-5 发布时他带头打了那场 ChatGPT Plus 额度争夺战之后，「每周都会收到这样的私信」。

　　最新一条是有人求他帮忙把 xhigh/heavy thinking 要回来。

　　跑分最强的那天，是发布日

　　chatgptdisaster.com 整理了 1087 条经过验证的用户投诉，其中一类被反复提到的场景叫「路由层失灵」，UI 显示 GPT-5.5 Pro，输出完全是另一个档次的东西。

　　用户描述了一个可复现的模式，长会话后模型开始「完全无视你说的话」，但模型选择器上还挂着顶配标签。

　　最荒诞的注脚是，Plus 用户 160 条/3 小时用完后自动切换 mini 的机制，在 OpenAI 官方文档里被描述为一项「功能」。

　　为什么会这样？Lisan al Gaib 分析认为，答案就两个字，省钱。

　　算力与盈利能力的紧缩正影响着每一个人。处处精打细算，不放过任何省钱的机会。

　　然而，就在 GPT-5.5 用户集体投诉的同一周，GPT-5.6 的身影已经出现在了 Codex 后台日志里。

　　内部代号 iris-alpha，150 万 Token 上下文，Polymarket 给出的 6 月发布概率超过 85%。

　　一边是 5.5 用户连基础体验都保不住，一边是 5.6 已经在后台悄悄跑真实流量。

　　这就是 2026 年的 ASI 竞赛。

　　造新模型的速度越来越快，但让旧模型好好跑完一个会话却越来越难。

　　跑分最强的那一天永远是发布日，之后每一天都是薛定谔的 GPT。

　　参考资料：

　　https://x.com/scaling01/status/2058643470357590058?s=20

　　编辑：摩西

实锤！GPT-5.5「降智」被抓，OpenAI官方文档认了

我们的产品

相关链接

关于我们

联系我们