GPT-5.6紧急叫停!OpenAI最强模型被迫「一客一审」

  新智元报道

  三家最强模型,竟然一个都没用上!就在今天,GPT-5.6 也被紧急叫停,进入「逐个审批」时代。

  Fable 5 没等来,GPT-5.6 也被紧急叫停了!

  刚刚,Information 独家称,出于网络安全考量,OpenAI 被要求「错峰」发布最强新模型。

  目前,只先开放给一小撮合作伙伴的有限预览,暂不面向全网一键解锁。

  让人窒息的是审批方式——所有人的试用权限均需进行「逐一审批」。

  换句话说,谁能用上 GPT-5.6、什么时候能用,OpenAI 说了不算,必须经过严格的排队准入。

  这在 AI 发布史上,还是头一遭。

  网友纷纷感慨,大模型的「发布自由」时代,或许已正式画上句号。

  GPT-5.6 分阶段上线

  强制「一客一审」

  在周三的内部Q&A上,奥特曼告诉员工,GPT-5.6 将以有限预览的形式,先发给一小群合作方;

  到了周四的备忘录里,他把那句最关键的话写得明明白白——

  在这个预览阶段,客户将被逐一审批「访问权限」。

  要知道,过去十年,硅谷大模型领域的竞争法则唯有一个字:快。

  谁能抢先发布,谁就抢占心智、抢占 API 调用、抢占开发者生态。

  而现在,OpenAI 要做的,是把最强的旗舰模型握在手里,等着客户排着队、等逐一盖章放行。

  至于原因,奥特曼说得很克制:出于安全方面的审查考量,需要分阶段放量。

  换句话说,GPT-5.6 成了某种「特供版」。

  目前,已有开发者发现,GPT-5.6-Preview 标志在代码中现身,已向某些合作企业正式开放。

  前端 UI 设计,GPT-5.6 实力大涨

  截至目前,GPT-5.6 更深层技术细节的讨论,已在全网持续升温。

  最先露出马脚的,是它的内部代号。开发者在 Codex 的测试路径里扒出了一串 checkpoint 代号。

  最被反复提及的那个,叫 kindle-alpha——据称就是这次的发布候选版本。

  有人甚至在 ChatGPT 的代码里,直接翻到了/admin/model-access/gpt-5.6-preview这样的访问路由。

  这套「读路由日志当发布日历」的玩法,如今成了预判 OpenAI 出招最灵的信号。

  还有开发者扒出了,GPT-5.6 全家族模型,其中一款是 GPT-4o 级别语音模型的「GPT-Bidi-1」。

  至于 GPT-5.6 的真实实力究竟有多强?

  从近期全网流出的灰度测试 demo 中,或许能窥见其冰山一角。

  开发者 Chetaslua 用 GPT-5.6,成功打造了一款《模拟人生》游戏,仅用 48 分钟一个样本完成。

  不得不说,AI 在游戏开发与前端渲染领域展现出了惊人的效率。

  同时,GPT-5.6 Pro 也展现了极强的视觉构建能力——

  仅用 HTML 制作了一个类似《我的世界》的体素风格 3D 孔雀动画!

  只需一张图、一句话,GPT 5.6 Pro 便设计出一个精美的前端 UI。

  接下来,是一场 GPT-5.6 Pro 和 Fable 5 真实对战。

  这是针对游戏逻辑、UI 和 3D 实现能力进行的硬核比拼。

  不过,在完全相同的指令下,Fable 5 的生成表现明显优于 GPT-5.6 Pro,且整个过程完全脱离外部素材辅助,具备了更强的底层生成力。

  此外,GPT-5.6 可能具备 150 万 token 上下文窗口,比 GPT-5.5 的 100 万一口气涨了约 43%。

  说白了,它能一次性「吞下」整个代码库、或者好几本书,从头读到尾不串行。

  至于模型的 reasoning effort 预算,从 768 提到了 960,推理「挡位」同时被拉高。

  而且,在长链条 Agent 任务上,token 消耗据称比 GPT-5.5 再省 10%~15%。

  此前,OpenAI 首席科学家 Jakub Pachocki 表示,内部把 GPT-5.6 定调为「一次有意义的进步」。

  如今,这个全网期待的 GPT-5.6,发布的开关被拿走了。

  三大旗舰,集体卡在了六月

  不止 OpenAI,六月本该是大模型的「超级月份」,结果「御三家」最强选手齐刷刷哑了火。

  OpenAI 的 GPT-5.6,已被摁进了「逐个客户审批」的队列;

  Anthropic 的 Fable 5 和 Mythos 5,发布三天就被一纸出口管制令撤下。两家顶尖实验室,双双被同一只手卡住了发布闸门。

  再看第三家——谷歌的 Gemini 3.5 Pro。

  I/O大会上高调亮相、号称 200 万 token 上下文 + Deep Think 深度推理的旗舰,原定六月正式上线。

  皮查伊当时在台上甩下一句「再等一个月」,台下开发者据说集体发出一声叹息。

  结果六月都快过完了,它还卡在有限预览里,迟迟没能落到普通用户手上。

  谷歌的延期,和前两家不是一回事。

  Gemini 3.5 Pro 跳票到七月,官方给的理由是打磨质量、吸收早期测试反馈、解决此前 Flash 版本暴露的 token 消耗问题,为更长链条的智能体任务做准备。

  换句话说,OpenAI 和 Anthropic 是被外部力量摁住,谷歌更多是自己踩了刹车。

  可结果呢?殊途同归。六月这道线,三家一个都没迈过去。

  地表最强的三款模型,齐刷刷停在了发布的门口,集体把档期挪到了七月。

  所有人以为自己马上要用上「史上最强 AI」,现实却是:最强的那一代,还在门里。

  门内的能力一路狂飙,门外的人却要排队领号。

  这道缝隙拉得越大,「最强 AI 早已造出、只是没放出来」那句玩笑,就越接近现实。

  只是这一次,公众要学会的第一件事,叫等待。

  参考资料:

  https://x.com/daniel_mac8/status/2070246365192438138?s=20

  https://www.theinformation.com/articles/trump-administration-asks-openai-stagger-release-new-model-security-concerns

  编辑:桃子