国思软件 - Claude Fable 5，名存实亡

　　新智元报道

　　Fable 5 刑满归来，但跑分却断崖暴跌。翻进官方文档才发现：你付着 Fable 的钱，跑的可能一直是 Opus。

　　别高兴得太早！

　　你眼前的 Fable 5，大概率只是一具空壳。

　　当它带着万众期待宣告回归，现实却极其惨烈。

　　就在模型恢复上线的第一时间，BridgeMind 火速重跑了 BridgeBench 基准测试。

　　结果不仅是翻车，而是彻头彻尾的崩盘——

调试能力从 86.2 直线坠落至 25.9，狂跌百分之七十。
重构能力从 73.6 暴跌至 38.4，直接腰斩。
连最基础的幻觉指标，也从 75.9 狼狈滑落到 61.7。

　　一夜之间，开发者社区彻底炸锅。

　　「Fable 5 被物理阉割」的怒骂声，震耳欲聋。

　　花着 Fable 的钱，跑的却是 Opus

　　开发者 kaize 满怀期待，把个人项目交给 Fable 5 去做安全审计。

　　结果，迎面撞上的却是一堵冰冷的墙：违反规则，拒绝执行。

　　有人只是做个普通的教育工具，就莫名其妙触发了安全标记，直接被系统一脚踢出 Fable。

　　还有人发现，只要你的项目敢沾一点 AuthN 或 AuthZ 认证模块，几乎百分之百会触发护栏。

　　绝望的网友甚至建议，Fable 5 干脆改名叫 Feeble 5（虚弱5）算了。

　　把数据拆开后，BridgeMind 发现，测试的 12 道题里，只有可怜的 3 道真正跑在了 Fable 5 上。

　　剩下 9 道全被安全分类器半路拦截，悄无声息地上演了一出狸猫换太子，强行切成了上一代的 Opus 4.8。

　　按照 BridgeBench 的计分规则，凡是被护栏强制降级的题目，直接记零分。

　　那 9 道题，就这么硬生生吃了鸭蛋。

　　对此，BridgeMind 的分析是：「只要任务能跑通，Fable 5 和 6 月 12 日被禁前那个版本一模一样强。问题出在护栏上。」

　　换句话说，模型没有变蠢，只是在绝大部分时间里，你根本就没在用它。

　　Anthropic：就是故意的

　　如果只是护栏太严，调松一点就完了。

　　但令人绝望的是，这不是 bug，是 Anthropic 深思熟虑、甚至引以为傲的顶层设计。

　　官方博文上白纸黑字写得清清楚楚：「我们刻意将安全分类器设置为，会对一组我们知道大概率无害的请求触发拦截。」

　　意思就是，他们明知道你的请求大概率没问题，却还是选择把大门死死焊上。

　　更让人后怕的是审查范围。

　　触发降级的检查，不会只盯着你刚发的那句话，而是模型能够读取的全部内容——

你的历史对话记忆
你接入的各种连接器
网络搜索的返回结果
甚至是你上传的每一份文件

　　你可能啥字都还没敲都没碰，但因为几天前上传了某份文件，Fable 5 就被强制切成了 Opus 4.8。

　　这个自动降级在 Claude、Claude Code、Claude Cowork 和 Microsoft 365 里全部默认开启。

　　你不主动关，它就替你做主。

　　事已至此，开发者的怒火已经被彻底点燃。

　　网友 alexenpr 在X上大吐苦水：

　　以前丢给 Fable 5 同样的任务，它会静静思考二十多分钟，给出一套极其深思熟虑的方案。

　　现在呢？它吐答案比 Opus 还快，但质量却惨不忍睹。

　　一个 Bug 修了一个多小时，依然满屏报错。切回老旧的 Opus，反而瞬间修好了。简直是个天大的笑话。

　　开发者 MaxLumnar 则发现，模型 token 的消耗量非常夸张。

　　5 小时的 Max x5 额度短短 15 分钟就被系统彻底烧光.更绝望的是，似乎连 Opus 也跟着一起变蠢了。

　　媒体 thehypedotnews 做了一组实测。

　　他们让 Fable 5 通过 API 生成五个 HTML 动画。结果，2 个渲染错误，3 个质量拉胯。

　　白白花了 7 分 25 秒和 6.48 美元，最后没有一个能用的。

　　篡改 prompt、全球拉闸、误杀成灾

　　6 月 9 日，共享同一个大脑的 Fable 5 和 Mythos 5 同时亮相。

　　仅仅两天后，社区骇然发现，Fable 5 的体内竟暗藏着一个反蒸馏护栏。

　　没有通知，没有提示，直接在底层暗中篡改你的 prompt，逼迫模型悄无声息地吐出有缺陷的劣质代码。

　　SemiAnalysis 一针见血：「如果你是竞争对手，Claude Fable 5 被允许蓄意破坏你的应用。」Anthropic 当天道歉，承诺改成可见的回退机制。

　　6 月 12 日，Amazon 安全团队递交越狱报告，声称 Fable 5 能识别软件漏洞并产出利用代码。

　　商务部长 Howard Lutnick 震怒，直接发函下达全球禁令。连 Anthropic 自家非美籍员工都不能碰。

　　但最荒诞的黑色幽默来了。

　　Anthropic 在回归博文里表示，他们把市面上的模型全测了一遍，Opus 4.8 能做到，GPT-5.5 能做到，连自家最廉价的 Haiku 4.5 都能复现这个漏洞。

　　按他们的话说，Fable 5 压根没有变得更危险。它只是在美国政府眼皮子底下暴露了护栏失灵。

　　但对 Anthropic 来讲，丢了面子、惹怒了监管，比模型到底有多危险要致命得多。

　　熬过漫长的 19 天。

　　终于刑满释放的 Fable 5，在 7 月 1 日带着「全新的护栏」重返舞台。

　　商务部下属的 AI 标准与创新中心做完验收，给出四个字的评价：异常强大。

　　确实强大，强大到 75% 的正常调试任务，都被扼杀在摇篮里。

　　最贵的模型，大部分时间不让你用

　　所以真相是大概率是，Fable 5 并没有被「阉割」。

　　它的智商没掉，代码能力也未曾缩水。只要上场，就能和被禁之前一样强。

　　但问题就在这里，在绝大部分时间里，它压根就上不了场。

　　那道被官方「有意设宽」的护栏，像幽灵一样，盯着着你的全部上下文。

　　而你无法预判，它会在哪个瞬间把你一脚踢回 Opus 4.8。

　　你付着顶配的价钱，换来的，却是一个大部分时间都被死死锁在铁笼里的模型。

　　Dario 说要保护世界，免受「危险 AI」之害。

　　可谁来保护开发者，免受 Anthropic 之害？

　　参考资料：

　　https://x.com/bridgemindai/status/2072662214704533888?s=20

　　https://x.com/Hesamation/status/2072692225100612032?s=20

　　编辑：摩西

Claude Fable 5，名存实亡

我们的产品

相关链接

关于我们

联系我们