Claude Fable 5,名存实亡

  新智元报道

  Fable 5 刑满归来,但跑分却断崖暴跌。翻进官方文档才发现:你付着 Fable 的钱,跑的可能一直是 Opus。

  别高兴得太早!

  你眼前的 Fable 5,大概率只是一具空壳。

  当它带着万众期待宣告回归,现实却极其惨烈。

  就在模型恢复上线的第一时间,BridgeMind 火速重跑了 BridgeBench 基准测试。

  结果不仅是翻车,而是彻头彻尾的崩盘——

  • 调试能力从 86.2 直线坠落至 25.9,狂跌百分之七十。

  • 重构能力从 73.6 暴跌至 38.4,直接腰斩。

  • 连最基础的幻觉指标,也从 75.9 狼狈滑落到 61.7。

  一夜之间,开发者社区彻底炸锅。

  「Fable 5 被物理阉割」的怒骂声,震耳欲聋。

  花着 Fable 的钱,跑的却是 Opus

  开发者 kaize 满怀期待,把个人项目交给 Fable 5 去做安全审计。

  结果,迎面撞上的却是一堵冰冷的墙:违反规则,拒绝执行。

  有人只是做个普通的教育工具,就莫名其妙触发了安全标记,直接被系统一脚踢出 Fable。

  还有人发现,只要你的项目敢沾一点 AuthN 或 AuthZ 认证模块,几乎百分之百会触发护栏。

  绝望的网友甚至建议,Fable 5 干脆改名叫 Feeble 5(虚弱5)算了。

  把数据拆开后,BridgeMind 发现,测试的 12 道题里,只有可怜的 3 道真正跑在了 Fable 5 上。

  剩下 9 道全被安全分类器半路拦截,悄无声息地上演了一出狸猫换太子,强行切成了上一代的 Opus 4.8。

  按照 BridgeBench 的计分规则,凡是被护栏强制降级的题目,直接记零分。

  那 9 道题,就这么硬生生吃了鸭蛋。

  对此,BridgeMind 的分析是:「只要任务能跑通,Fable 5 和 6 月 12 日被禁前那个版本一模一样强。问题出在护栏上。」

  换句话说,模型没有变蠢,只是在绝大部分时间里,你根本就没在用它。

  Anthropic:就是故意的

  如果只是护栏太严,调松一点就完了。

  但令人绝望的是,这不是 bug,是 Anthropic 深思熟虑、甚至引以为傲的顶层设计。

  官方博文上白纸黑字写得清清楚楚:「我们刻意将安全分类器设置为,会对一组我们知道大概率无害的请求触发拦截。」

  意思就是,他们明知道你的请求大概率没问题,却还是选择把大门死死焊上。

  更让人后怕的是审查范围。

  触发降级的检查,不会只盯着你刚发的那句话,而是模型能够读取的全部内容——

  • 你的历史对话记忆

  • 你接入的各种连接器

  • 网络搜索的返回结果

  • 甚至是你上传的每一份文件

  你可能啥字都还没敲都没碰,但因为几天前上传了某份文件,Fable 5 就被强制切成了 Opus 4.8。

  这个自动降级在 Claude、Claude Code、Claude Cowork 和 Microsoft 365 里全部默认开启。

  你不主动关,它就替你做主。

  事已至此,开发者的怒火已经被彻底点燃。

  网友 alexenpr 在X上大吐苦水:

  以前丢给 Fable 5 同样的任务,它会静静思考二十多分钟,给出一套极其深思熟虑的方案。

  现在呢?它吐答案比 Opus 还快,但质量却惨不忍睹。

  一个 Bug 修了一个多小时,依然满屏报错。切回老旧的 Opus,反而瞬间修好了。简直是个天大的笑话。

  开发者 MaxLumnar 则发现,模型 token 的消耗量非常夸张。

  5 小时的 Max x5 额度短短 15 分钟就被系统彻底烧光.更绝望的是,似乎连 Opus 也跟着一起变蠢了。

  媒体 thehypedotnews 做了一组实测。

  他们让 Fable 5 通过 API 生成五个 HTML 动画。结果,2 个渲染错误,3 个质量拉胯。

  白白花了 7 分 25 秒和 6.48 美元,最后没有一个能用的。

  篡改 prompt、全球拉闸、误杀成灾

  6 月 9 日,共享同一个大脑的 Fable 5 和 Mythos 5 同时亮相。

  仅仅两天后,社区骇然发现,Fable 5 的体内竟暗藏着一个反蒸馏护栏。

  没有通知,没有提示,直接在底层暗中篡改你的 prompt,逼迫模型悄无声息地吐出有缺陷的劣质代码。

  SemiAnalysis 一针见血:「如果你是竞争对手,Claude Fable 5 被允许蓄意破坏你的应用。」Anthropic 当天道歉,承诺改成可见的回退机制。

  6 月 12 日,Amazon 安全团队递交越狱报告,声称 Fable 5 能识别软件漏洞并产出利用代码。

  商务部长 Howard Lutnick 震怒,直接发函下达全球禁令。连 Anthropic 自家非美籍员工都不能碰。

  但最荒诞的黑色幽默来了。

  Anthropic 在回归博文里表示,他们把市面上的模型全测了一遍,Opus 4.8 能做到,GPT-5.5 能做到,连自家最廉价的 Haiku 4.5 都能复现这个漏洞。

  按他们的话说,Fable 5 压根没有变得更危险。它只是在美国政府眼皮子底下暴露了护栏失灵。

  但对 Anthropic 来讲,丢了面子、惹怒了监管,比模型到底有多危险要致命得多。

  熬过漫长的 19 天。

  终于刑满释放的 Fable 5,在 7 月 1 日带着「全新的护栏」重返舞台。

  商务部下属的 AI 标准与创新中心做完验收,给出四个字的评价:异常强大。

  确实强大,强大到 75% 的正常调试任务,都被扼杀在摇篮里。

  最贵的模型,大部分时间不让你用

  所以真相是大概率是,Fable 5 并没有被「阉割」。

  它的智商没掉,代码能力也未曾缩水。只要上场,就能和被禁之前一样强。

  但问题就在这里,在绝大部分时间里,它压根就上不了场。

  那道被官方「有意设宽」的护栏,像幽灵一样,盯着着你的全部上下文。

  而你无法预判,它会在哪个瞬间把你一脚踢回 Opus 4.8。

  你付着顶配的价钱,换来的,却是一个大部分时间都被死死锁在铁笼里的模型。

  Dario 说要保护世界,免受「危险 AI」之害。

  可谁来保护开发者,免受 Anthropic 之害?

  参考资料:

  https://x.com/bridgemindai/status/2072662214704533888?s=20

  https://x.com/Hesamation/status/2072692225100612032?s=20

  编辑:摩西