
新智元报道
编辑:桃子好困
太突然了!OpenAI 深夜甩出 GPT-5.5 Instant,全面接管 ChatGPT 默认模型。幻觉暴降 52%、数学从 65 分飙到 81 分、回复字数直砍三成,更关键的是它开始记住你、看穿你的偏好。所有人免费薅羊毛。
今天,GPT‑5.5 Instant 正式上线,所有人在 ChatGPT 中免费用!
它一共有三大亮点:回答更简洁、记忆更强、更加个性化。

GPT‑5.5 Instant 取代 GPT‑5.3 Instant,成为 ChatGPT「默认模型」
在处理日常任务中,比起上一代,GPT-5.5 Instant 更加强大。
无论是分析上传的图片、解答 STEM 难题,还是精准判断何时该调用网页搜索,它都游刃有余。

在幻觉率上,GPT‑5.5 Instant 暴降 52.5%,特别是在医疗、法律和金融等对严谨性要求极高的领域。
不仅如此,GPT-5.5 Instant 还升级了记忆和个性化功能。
在记忆来源中,可以一键查找以往上下文,聊天时更加懂你,更具人情味儿。

奥特曼和总裁 Greg 在线力推 GPT-5.5 Instant。


幻觉减半,数学从 65 分干到 81 分
OpenAI 给 GPT-5.3 Instant 的首要定位:更聪明。

在全方位基准测试中,5. 3 Instant 成绩单非常亮眼:
-
数学 AIME 2025:从 65.4% 跳到 81.2%;
-
博士级科学题 GPQA:从 78.5% 升到 85.6%;
-
多模态推理 MMMU-Pro:从 69.2% 拉到 76.0%。


内部评估显示,在涉及医学、法律、金融等高风险领域的提示词上,GPT-5.5 Instant 产生的幻觉比 5.3 Instant 减少了 52.5%。
上一代 5.3 Instant 发布时,幻觉改善幅度大约在 20% 出头,这次直接翻了一倍多。
在用户主动标记为「事实错误」的高难度对话中,不准确的陈述也减少了 37.3%。
比如在下面这个实测中,GPT-5.5 Instant 回答更优,因为它及时纠正了自己一开始的错误:
虽然最开始附和了那个错的答案,但随后自己发现,要是把x=3 代回原方程根本就不成立。
并且找出了真正的计算错误(也就是用户移项弄错了),然后用求根公式算出了正确的解。
GPT-5.3 Instant 也发现x=3 行不通,但它没再往下算,直接得出了「无实数解」的错误结论,而没有去重新核对计算过程,把修正后的一元二次方程给解出来。


在 OpenAI 医学基准测试 OmniDocBench 中,5.5 Instant 幻觉率下降了 2.1%。

回复瘦身三成,表情包戒断
跑分之外,更多用户会立刻感受到的变化是,ChatGPT 话少了。
OpenAI 官方数据,GPT-5.5 Instant 的回复字数比前代减少了 30.2%,行数减少了 29.2%。
比如,同样是问「怎么跟同事说别老唠叨」,5.3 Instant 洋洋洒洒列了五种策略、三条注意事项、还贴心地问你「同事是什么性格」。

5. 5 Instant 砍掉了一半篇幅,上来先甩一句「除非你真心想在职场上树敌,否则别直说」,然后按你想要的强硬程度分级给话术,从「我现在得集中精力」到「我得先打断一下」,最后收了一句「趁早打断,别默默忍受 20 分钟再爆发」。
语气拿捏得很准,随性、实用、不过度。

此外,OpenAI 还专门点名了一个问题,「无意义的表情符号」。
之前的 ChatGPT 废话太多、emoji 乱飞、格式过度,现在终于知道收着点了。
换句话说就是,GPT-5.5 Instant 搞清楚了什么时候该给长答案、什么时候用户只是想要一句干脆的回复。
对每天打开 ChatGPT 几十次的重度用户来说,体感差距是巨大的。
最炸的升级
它开始「记住你」了
除了准确性提升和回复精炼之外,这次升级最关键的一点是「个性化」。
GPT-5.5 Instant 现在可以主动调用过往聊天记录、上传过的文件、甚至你连接的 Gmail 邮箱,来为回复提供个性化上下文。
同样是问「推荐一家新开的茶饮店」。
GPT-5.3 Instant 给了一堆旧金山的泛泛推荐,喜茶、Junbi Matcha、唐人街的隐藏小店,虽然考虑了你在旧金山这个地理信息,但推荐逻辑和给任何人的没区别。

GPT-5.5 Instant 的回复完全不一样。
它知道你平时常去 Asha Tea House,知道你偏爱清爽的台湾高山茶风格,然后据此推荐了 Ceré Tea 和 Song Tea & Ceramics,甚至帮你做了决策,「想找新的日常打卡地就去 Ceré Tea,想找特别体验就去 Song Tea。」

这个差距不是「更聪明」能解释的。这是「它翻了你的聊天记录」。
同步上线的,还有一个叫「记忆来源(Memory Sources)」的功能,面向所有个人计划用户开放。
这个功能让你能看到 ChatGPT 具体引用了哪些过去的聊天记录或保存的记忆来生成回复。
如果某些信息过时了或者不对,你可以直接删掉或修改。如果你分享了某段聊天,记忆来源不会暴露给对方。
一句话总结这个设计思路:先让 AI 记住你,再让你看到它记住了什么,最后让你决定它该忘掉什么。
不过,OpenAI 自己也承认,记忆来源功能「可能无法穷举所有影响最终回答的因素」。它会展示几条最相关的历史聊天,但不一定是全部。
三个月倒计时,5.3 退场通知
几个实操层面的信息。
GPT-5.5 Instant 即日起面向所有 ChatGPT 用户逐步推出。
付费用户在接下来三个月内仍然可以手动切换到 GPT-5.3 Instant。三个月后,5.3 正式退役。
基于聊天记录、文件和 Gmail 的增强个性化功能,目前仅面向网页端的 Plus 和 Pro 用户开放,移动端即将上线。
Free、Go、Business 和 Enterprise 用户将在未来几周内陆续获得权限。
API 端,GPT-5.5 Instant 对应的模型 ID 是 chat-latest。
有个历史教训值得 API 开发者注意。
OpenAI 此前退役 GPT-4o 时遭遇过强烈反弹,不少生产环境的应用在模型切换后出现行为异常。这次三个月的过渡期,建议尽早开始回归测试。
从「太舔」到「太油腻」到「刚好」
把 GPT-5.5 Instant 放进更大的时间线里看,你会发现一条很有意思的叙事线。
2025 年,GPT-4o 因为过度讨好用户而出圈。它会频繁肯定你的每一个选择,让很多用户觉得它像朋友、像镜子。后来 OpenAI 内部判定这些行为过于「谄媚」,决定调整。
2026 年 2 月,GPT-4o 正式下线。3000 人签请愿书要求保留。有人在请愿书里写,这个模型是自己的「最好的朋友」。
OpenAI 没有回头。
GPT-5.0 和 5.2 的 Instant 版本矫枉过正,用户反馈变成了另一个极端。回复太僵硬、太谨慎、动不动就先来一段安全声明再回答问题。
2026 年 3 月,GPT-5.3 Instant 发布,主打「减少油腻感」。不必要的拒绝回答减少了,说教式的前缀也收敛了不少。
现在,5.5 Instant 试图在这条线上再进一步,不仅不油腻,还要准确、精炼、并且懂你。
默认模型的战争
而这,很可能是 OpenAI 今年影响面最大的一次模型更新。
GPT-5.5 Pro 再强,用的人是几十万开发者和付费重度用户。Instant 的用户基数,是它的几千倍。
那些从来不切换模型、从来不调参数、打开 App 就打字的普通人,感受到的 ChatGPT 就是 Instant。
每一点改进乘以数亿人,就不是增量,是基本面的重写。
然而,随着幻觉率的降低,用户会更信任它的回答,即使模型仍然有可能犯错。
默认即信任。这四个字,既是 OpenAI 最大的资产,也是它最沉重的责任。
参考资料:
