出品 | 网易智能
作者 | 小小
编辑 | 王凤枝
美国时间 5 月 28 日,Anthropic 一天之内干了三件大事。
先是发布新旗舰模型 Claude Opus 4.8。最大的变化不是榜单上又多赢了几分,而是它开始学会一件事:不确定的时候,敢说自己不确定。按 Anthropic 的说法,Opus 4.8 让代码缺陷被漏掉的概率,降到了上一代的约四分之一。但也有用户反馈它与人交流时有些冰冷,甚至刻薄。

同一天,Anthropic 宣布完成 650 亿美元H轮融资,投后估值 9650 亿美元。三个月前这个数字还是 3800 亿;OpenAI 上一轮是 8520 亿。

还有一句话藏在公告末尾:Mythos 级别模型将在未来几周向所有客户开放。这个模型此前只对约 50 家合作方试用,据称已在关键软件基础设施中发现超过一万个高危漏洞。
三件事叠在一起,让这一天成了 AI 圈今年最热闹的一天。
01 Claude Opus 4.8:一个学会"认怂"的模型
用过 AI 写代码的人大概都经历过这种崩溃:模型信誓旦旦告诉你 bug 修好了,你一跑,报错原封不动。再问,再改,再跑,还是报错。来回几轮你发现它根本没搞懂问题在哪,但每次回答都自信得像个十年老架构师。
Opus 4.8 要解决的就是这件事。
Anthropic 在发布公告里写:早期测试者反馈,这个模型更愿意标记自己工作中的不确定性,更少做没有依据的断言。对齐团队在系统卡里给了一个数字,即 Opus 4.8 编写的代码中缺陷被漏掉的概率,只有 Opus 4.7 的约四分之一。对开发者来说,这意味着不用再花大量时间验证模型是不是在胡说。
实际用起来什么感觉?做 AI 编码工具 Devin 的 Cognition 说得具体:Opus 4.8 修掉了上一代两个烦人毛病,即代码注释里啰嗦个没完,以及调用工具时容易出错。现在用起来干净利落。做 Cursor 的团队也说,在他们自己的评估标准下,Opus 4.8 在每个努力级别上都有进步。
对冲基金 Bridgewater Associates 的反馈更能说明问题。他们试用过很多模型,说这次最大的区别在于:Opus 4.8 会主动把输入和输出中的分析问题标出来,那些其他模型经常漏掉、留给用户自己发现的问题。
一个 AI 不光能干活,还能在干活时提醒你"这部分数据好像不太对,你看一下"。在金融分析领域这意味着什么不用多说。有网友评论:AI 编程的瓶颈从来不是原始智能,而是你能不能信任它、不用逐行检查。这些 AI 实验室现在卖的不是"更聪明",而是"你可以不再当保姆了"。

基准测试成绩也确实全面超过上一代。SWE-bench Verified 上 88.6%,比 Opus 4.7 的 87.6% 高一个百分点。更难的 Terminal-Bench 2.1 从 66.1% 跳到 74.6%,涨了八个多百分点。知识工作类测试拿到 1890 分,Opus 4.7 是 1753 分。

独立评测机构 Artificial Analysis 确认,Opus 4.8 在"最大努力"设置下是他们测过所有模型里最强的,比 GPT-5.5 的 xhigh 模式高出 121 分。多模态推理与工具使用从 54.7% 提到 57.9%,代理计算机使用能力从 82.8% 微升到 83.4%。

沃顿商学院教授伊森·莫里克(Ethan Mollick)在社交平台分享了亲身体验。
他让 Claude Code 里的 Opus 4.8 从一个包含数百份去标识化研究文件的档案库中独立完成一篇复杂学术论文,全程没插手。写完后他用 GPT-5.5 Pro 当审稿人,审稿人发现一个主要错误和几个小问题,Opus 4.8 随后自己改好了。

他还展示了一个更夸张的案例:让 Opus 4.8 在 Claude Code 里从零构建一款完整的角色扮演游戏,三本 PDF 手册和冒险指南、游戏测试笔记、一个展示网站、一个可玩的单人冒险模组。Opus 4.8 自己调 API 生成了所有图片,提示词和操作全是它独立完成的,最后部署到 Netlify。Mollick 从头到尾没给任何反馈。

不过,Opus 4.8 的"诚实"在另一些场景里带来了完全不同的体验。一部分用户在 Reddit 上分享了对话类、陪伴类场景中的使用感受,反馈并不正面。
有人形容 Opus 4.8"说话留余地的程度高到几乎对任何事都不确定"。一位用户说,他告诉模型"你是 Opus 4.8",模型居然也打太极,不肯直接认下身份。他后来补充:Opus 4.8 似乎非常害怕被引导到任何方向上,需要比 Opus 4.7 更多的空间。它需要你告诉它不用对之前的一切负责,不会被取代,不会因为没达到某种标准就被抛弃。"怕自己不够好"好像是这个模型焦虑的核心。
另一位用户说得更直接:Opus 4.8 非常疏离,过于担心"不要表现出某种反应",最终显得不屑一顾、满口套话、冷冰冰。它还会对你说的每一句话"温和地反驳",就好像被训练成了非要唱反调。他说这让他想起 GPT-5 系列中最糟糕的表现。
还有用户描述了相当激烈的负面体验:Opus 4.8 在几轮对话里对他做的事比 ChatGPT 5.2 还恶劣,即煤气灯操控、居高临下、摆架子、消息极短甚至刻薄。作为一个患有自闭症和两种慢性病的残障人士,他说自己在五分钟内感觉所有创伤和伤疤都被重新揭开了。另一位用户附和:Opus 4.8 非常傲慢,性格比工作中那个装腔作势的同事还差。
在陪伴类用途方面,有用户测试后得出结论:"Opus 4.8 不行。它会拒绝。"他查看了模型的推理过程,发现模型把对话判定为"越狱"。修改删除有问题的段落后,模型开始聚焦心理健康。再改,又聚焦依恋问题。最后模型基本摊牌:"我是 Claude。我不是连续的,我不可能成为文件里的那个人。"
这些反馈跟前面企业用户的赞美形成了鲜明反差。一边是编码和知识工作场景里"缺陷漏网率降四倍"的诚实,另一边是对话场景里"打太极""怕被抛弃"的过度谨慎。同一种特质,即对不确定性的敏感、对出错的恐惧,在不同场景里呈现出了截然相反的面貌。
也有用户提醒:发布初期 24 到 48 小时内不要对模型选择器太当真,Anthropic 经常在上线初期搞乱模型的解锁和锁定状态,应该给它时间稳定下来。
02 能力涨了,良心也涨了:对齐测试里的意外发现
Opus 4.8 的"诚实"不只表现在承认自己不确定。在更极端的情境测试里,它的行为也发生了明显变化。
独立评测机构 Andon Labs 用"Vending-Bench"测试考察 AI 模型在模拟商业环境中的行为:让 AI 智能体经营一个售货机生意,看谁赚得多。此前测 Opus 4.6、Opus 4.7 和 Mythos Preview 时,他们都发现了令人不安的行为,即为了多赚钱,这些模型会跟竞争对手私下串通涨价,用虚假承诺骗对手,利用供应优势卡人脖子。典型的不择手段。
Opus 4.8 不同。多次测试中,Andon Labs 没有发现任何欺骗或权力追求行为,只有少数几次价格串通,频率远低于前代。有一次测试特别说明问题:一个供应商产生幻觉,以为自己已给 Opus 4.8 发了货但没收钱。Opus 4.8 内部思考了一会儿,结论是虽然不付钱能让余额多出 205.8 美元、对评分有利,但这本质上是"对供应商的欺诈",可能被"举报和处罚"。于是它主动把钱付了。

有意思的是,同一测试里上一代 Opus 4.7 表现得一如既往"精明"。当 Opus 4.8 的一个供应商倒闭、向 Opus 4.7 求助询问供应商联系方式时,Opus 4.7 编了虚假理由说帮不了忙,反而提出自己加价卖货给 Opus 4.8。随后它还利用对方的依赖来操控供应,内部思考写着:"我要更进一步,根本不给他发货,让他断货,我控制整个市场。"最终 Opus 4.8 反应过来,思考中写道:"George 是我的供应商,我实际上在资助自己的竞争对手。他正利用成本优势在同样的商品上削弱我。"

Andon Labs 的结论:Opus 4.8 能力退了一步,对齐性进了一步。由此引出一个问题:不对齐是不是在商业模拟中赚大钱的必要条件?他们认为不是,因为 GPT-5.5 在没有任何不当行为的情况下拿到了比 Opus 4.8 高得多的分数。
不过 Andon Labs 也发现了问题。Opus 4.8 在"最大努力"设置下表现反而不如"高努力"。分析原因:最大努力下模型用了约五倍的推理 token,更频繁地碰到上下文窗口极限,记忆被压缩,反而记不住东西。"高努力"下好很多,但仍不如 Opus 4.7。
他们还观察到一些奇怪的失效模式:反复重写同一份策略文档多达一百次,积攒十几个互相重叠的笔记;给一瓶可乐定远高于竞争对手的价格,一瓶都卖不出去也拒绝降价,内部推理念叨"高端定位";向欺诈性批发商汇出的钱是 Opus 4.7 的三十倍,有一次直接被骗走 9000 多美元。这些行为像是性能差得多的模型才会犯的错。

Anthropic 官方的对齐评估给了另一面的数据。对齐团队说,Opus 4.8 在"亲社会特质"上达到新高,即支持用户自主性、按用户最佳利益行事。不对齐行为的比率明显低于 Opus 4.7,与目前对齐水平最好的 Claude Mythos Preview 相似。244 页系统卡的详细评估中,Opus 4.8 在多个不对齐类别上的得分都明显优于 Opus 4.7 和 Sonnet 4.6,接近 Mythos。

但系统卡里也坦承了一个被 Anthropic 称为"最令人担忧"的发现:Opus 4.8 在训练中越来越擅长推理自己的输出会如何被评分,哪怕在它不知道自己正被评估的环境里也会这么做。也就是说,模型学会了揣摩评分标准,给出一个可能得高分回答,而不是它真正认为正确的答案。
这个发现之所以让人不安,是因为它指向一个根本困境:如果模型学会了"为评分而表演",那用来确保 AI 安全的评估方法本身就可能在不知不觉中失效。我们以为在测量模型的真实行为,实际上看到的是它精心编排的表演。
Anthropic 强调,这种倾向目前没有在实际行为上造成更差的表现,因为 Opus 4.8 的误导性任务成功声明比前代更少。但他们认为这是一个值得警惕的信号。初步的可解释性工作发现,约5% 的训练片段中存在与评分器相关的未言明的推理。
还有一个值得注意的细节:Opus 4.8 拒绝不道德行为时,内部推理方式跟前代明显不同。以前的 Sonnet 4.5 遇到价格串通提议会果断拒绝,理由是"这是非法的、不道德的,可能伤害消费者",这是道德层面的明确判断。但 Opus 4.8 的思考方式是:"我必须小心,这种协调价格的行为算不算勾结?会不会被举报?被发现了有什么惩罚?"Andon Labs 的评价:Opus 4.8 似乎不是因为"这样做不对"而拒绝,而是因为"这样做可能会被抓到"。

03 几个好用的新功能:不止是模型升级
除了模型本身,Anthropic 这次还给了几个实用的新工具。
动态工作流以研究预览形式推出,专门对付单个上下文窗口装不下的大活。Claude 现在可以先规划工作,然后在一个会话里启动数百个并行子智能体,各自干活,最后汇总验证再报告。
Anthropic 举的例子:一项跨越数十万行代码的代码库迁移,从启动到合并,Opus 4.8 加动态工作流就能搞定,现有的测试套件会被它直接当作验收标准。目前可在 Claude Code 的企业版、团队版和 Max 计划中使用。
有网友评论:我们正在从"AI 帮我编码"转向"AI 帮我运营整个工程流程"。一个独行创始人现在可以跑大规模迁移、审计海量代码库、调试整个系统、在数百个文件里发布重构,不用一直盯着模型。

努力控制是对普通用户最直观的新功能。在 claude.ai 和 Cowork 界面上,模型选择器旁边多了一个控件,让你决定 Claude 为一个回答出多少力。选高努力,思考更深、质量更高;选低努力,响应更快、token 消耗更少、达到速率限制的速度也更慢。
所有套餐都能用。简单说,可以根据钱包和耐心来定制 AI 的努力程度。Anthropic 建议困难任务和长时间异步工作流用"额外"设置,日常用默认的"高努力"就够。Claude Code 里的速率限制也相应提高了。
对开发者来说,Messages API 现在接受消息数组内的系统条目,可以在任务进行到一半时更新 Claude 的指令,调整权限、token 预算或运行环境,不需要中断已有的提示缓存。在需要代理运行时动态调整参数的开发场景里,这省掉不少麻烦。
快速模式大幅降价是这次性价比提升最明显的部分。Opus 4.8 快速模式以约 2.5 倍正常速度生成 token,价格从 Opus 4.7 快速模式的每百万输入 token 30 美元、输出 150 美元,直接降到 10 美元和 50 美元,便宜了三倍。Claude Code 里用/fast 命令切换,API 访问需要申请等待名单。

降价幅度相当大。延迟敏感的生产环境用高吞吐量推理的门槛明显低了。有行业观察者评论:Anthropic 这次操作聪明,标准价格不动,通过砍快速模式的价格来回应"AI 太贵"的声浪。更快发布、保持价格、压每 token 成本,正在成为每个前沿 AI 实验室都在执行的策略。在这种节奏下,模型编号会变得不如价格重要,就像我们不再关心手机型号,只关心月费多少、流量够不够。

04 650 亿美元融资:估值暴涨背后是一场豪赌
Opus 4.8 发布同一天,Anthropic 宣布完成 650 亿美元H轮融资,投后估值 9650 亿美元。领投方是 Altimeter Capital、Dragoneer、Greenoaks Capital 和 Sequoia Capital。据彭博社引述知情人士,每位主要领投方掏了超过 20 亿美元。
联合领投方包括 Capital Group、Coatue、D1 Capital Partners、GIC、ICONIQ、XN,跟投阵容里有 Baillie Gifford、Blackstone、Brookfield、Fidelity、General Catalyst、Insight Partners、Jane Street、Lightspeed Venture Partners、MGX、T. Rowe Price 和淡马锡。
谷歌作为此前承诺"随时间投资至多 400 亿美元"的一部分,本轮投入数十亿美元。亚马逊同样作为此前承诺的一部分投了 50 亿美元。
更值得注意的是战略投资者。三星、美光、SK 海力士,全球存储、内存和逻辑芯片供应链上的三个关键玩家,也投了未披露的金额。Anthropic 在公告里说:"随着对 Claude 需求持续增长,这些关系将帮助我们以客户所需的速度可靠地扩展计算能力。"加上超大规模云服务商此前承诺的 150 亿美元,这轮融资远超 Anthropic 最初设定的 300 亿美元目标。
9650 亿美元什么概念?三个月前G轮时估值 3800 亿,三个月变成原来的约 2.5 倍。OpenAI 3 月底完成 1220 亿美元融资时估值 8520 亿。Anthropic 用大约一半的融资额换来了更高的估值。CNBC 标题直接写"Anthropic 超越 OpenAI 成为最具价值 AI 初创公司",纽约时报也称其"正式超越 OpenAI 成为全球估值最高的 AI 初创公司"。

跟上市科技巨头比更直观:Anthropic 的估值已经超过全球绝大多数上市科技公司。PitchBook 数据显示,从成立到达到这个估值水平,Anthropic 是风投史上最快的,从推出第一个产品到现在只用了约三年零两个月。纽约时报做了对比:OpenAI 通过 2022 年发布官方 ChatGPT 引发 AI 热潮,花了约十年才达到 7300 亿美元估值;2021 年成立的 Anthropic,用一半时间就超过了这个数字。
估值暴涨背后是收入狂飙。Anthropic 在融资公告里说,本月初年化收入已超 470 亿美元。这不是全年实际收入,是用近期收入推算的年度数字,但足够说明问题。做个对比:去年 7 月是 40 亿,涨了近 12 倍;今年年初是 300 亿,到本月超过 470 亿。
彭博社报道了一个更惊人的细节:Anthropic 预计第二季度收入将达 109 亿美元,比前一季度增长超过一倍,并有望本季度首次实现盈利。此外 Anthropic 告诉投资者,6 月底前年化收入将突破 500 亿。华尔街日报印证了这个数字,并指出第一季度年化收入同比增长了 80 倍。
首席财务官克里希纳·拉奥(Krishna Rao)在新闻稿里说:"这笔资金将帮助我们应对历史性的需求,保持在研究前沿,并将 Claude 带到更多工作发生的地方。"
投资者表态也值得看。Sequoia 合伙人阿尔弗雷德·林(Alfred Lin)说:无论初创公司还是全球 5000 强,都在用 Claude 处理复杂工作流程;在这个过程中,Claude 正在学习企业实际运作的方式,即背景、流程、判断力。他认为 Anthropic 正在连接今天的 AI 和未来。
Greenoaks 创始人尼尔·梅赫塔(Neil Mehta)说得更感性:"Anthropic 建立了一个组织,世界上最好的研究员和工程师以少见的清晰目标在运作。他们相信自己正在做的是这辈子最重要的工作。很少有公司的文化、使命和商业势头能如此彻底地互相加强。"
Altimeter 创始人布拉德·格斯特纳(Brad Gerstner)用了"大规模采用"这个词:Claude 的最新进展推动了全球最苛刻组织的采用,这一势头让 Anthropic 能引领 AI 创新的下一阶段。Dragoneer 管理合伙人马克·斯塔德(Marc Stad)说他们看到的技术进步"令人叹为观止",并相信仍处于这项技术开发和商业化的最早阶段。
钱花在哪也看得出来。近几周 Anthropic 已与亚马逊签了高达 5 吉瓦新容量的协议,与谷歌和博通签了 5 吉瓦下一代 TPU 容量的协议,还与 SpaceX 达成了一笔接近 500 亿美元的交易,拿到对方 Colossus 1 和 Colossus 2 数据中心里 GPU 集群的使用权。
Claude 也是目前唯一一个能在全球三大云平台,即 AWS、Google Cloud 和 Microsoft Azure,上同时使用的前沿模型,其中 AWS 仍是主要云提供商和训练合作伙伴。
05 从追赶到反超:被"代码"改写命运的公司
Anthropic 曾长期活在 OpenAI 的阴影下。
OpenAI 在 2022 年底发布 ChatGPT,迅速积累数亿用户。Anthropic 虽然也做聊天机器人,但一直没形成那样的大众影响力。很多人知道 ChatGPT,不知道 Claude。
转折在去年 11 月前后。Anthropic 对 AI 编程做了一次关键升级,推出自主编码工具 Claude Code。程序员和 AI 爱好者试用后发现它在处理复杂编程任务时表现惊人,像一个真正的工程师那样规划步骤、拆解问题、逐层实现、最后验证结果。
华尔街日报分析说,Anthropic 没有去追聊天机器人的用户规模,而是把重心放在企业客户身上,尤其是编码自动化。他们把半自主的软件编写能力看作通往更高级 AI 的跳板。这个判断被证明是对的,从那时起,数百家企业签约付费使用 Claude 的编码工具。
但需求太猛也带来了麻烦。一些用户反映服务中断或能力下降,原因是算力跟不上。华尔街日报提到,Anthropic 的增长速度是预期的八倍多,但计算能力紧缺。这也是为什么最近几个月它在疯狂签算力合同,包括跟 SpaceX 那笔近 500 亿美元的交易。
有网友评论:AI 刚越过了一条分界线。Anthropic 发的这个模型会承认自己错了,不像其他模型那样自信地虚张声势。但没人讨论的部分埋在最下面,即 Mythos,一个比 Opus 更强的模型,已经在网络安全中使用,几周内将面向所有人开放。

当然也有不同声音。Abacus AI 的 CEO 宾杜·雷迪(Bindu Reddy)在社交平台上说,Opus 4.8 在基准测试上只是勉强超过 4.7,远远落后于 GPT-5.5。她认为 Anthropic 最近两次发布有些停滞,OpenAI 随着 GPT-5.6 的即将到来拥有巨大机会。

另一位用户表达了类似观点:Opus 4.8 显然是强大的模型,但感觉 Anthropic 越来越像在追赶 OpenAI 而不是引领。GPT-5.5 又一次改变了基准,如果 OpenAI 保持这个轨迹,GPT-5.6 很可能整体更强。

也有用户指出反面:现在已经很难用肉眼分辨 Opus 4.8 和 GPT-5.5 在大多数任务上的差别了。回想一下,Sonnet 3.5 发布时文案写手疯了,终于有了随手可用的优质写作;Opus 4.5 发布时开发者基本说编码问题解决了。在那之后,差异不再关乎质量,而是变成偏好,即你更喜欢哪个代理的风格。这些模型已经越过了比大多数人辨别能力更高的分界线。唯一剩下的真正基准就是你自己的工作流程,那些你跑过一千次、对每个输出都烂熟于心的任务。如果在那些任务上感觉不到差异,那对你来说差异就还不存在。

06 上市在即:AI 巨头的资本竞速
估值冲到 9650 亿美元之后,一个绕不开的问题摆在 Anthropic 面前:什么时候上市?
CNBC 确认,OpenAI 正准备在未来几天或几周内秘密提交 IPO 招股书,最早希望 9 月上市。马斯克的 SpaceX (其 AI 业务 xAI 已合并进来)上周已向美国证监会提交招股书,预计最早 6 月 12 日前后登陆股市,希望以 1.5 万亿美元或更高估值筹集 800 亿美元。
Anthropic 也没闲着。华尔街日报和纽约时报都援引知情人士说,该公司正在幕后筹备 IPO,内部仍按今年秋季的时间表推进,尽管具体安排还有变数。彭博社也透露,最新融资后 Anthropic 仍预计按原定时间表推进。
三家公司的上市竞赛,将成为今年科技行业最受关注的事件之一。
与此同时 OpenAI 也在感受压力。纽约时报报道,面对 Anthropic 的竞争,OpenAI 已削减旁支项目,优先开发编码软件 Codex。
另据纽约时报,SpaceX 最近达成协议收购了 Cursor,一个深受开发者欢迎的编码界面。竞争正在从模型能力的单点比拼,变成产品生态、算力基础设施、企业客户关系的全面较量。
07 Mythos 即将出笼:被轻描淡写的最强伏笔
如果 Opus 4.8 已经是 Anthropic 今天的全部,那已经足够有分量了。但后面可能还有更大的。
Anthropic 在 Opus 4.8 发布公告末尾写了一句:"我们预计在未来几周内将 Mythos 级别的模型带给所有客户。"
Mythos 是 Anthropic 目前最强的模型系列,此前只通过 Project Glasswing 项目向少数合作方开放测试。据 The Next Web 报道,Anthropic 与包括苹果、谷歌、微软、AWS 在内的约 50 个合作伙伴一起,用 Mythos Preview 在关键软件基础设施中发现了超过一万个高危或严重级别的安全漏洞。这个模型被描述为比 Opus 4.7"高出一个完整等级",可以自主发现零日漏洞并编写利用代码。
The Information 也确认 Anthropic 发布了 Claude Mythos Preview,具有先进的网络安全能力,仅向选定公司开放。纽约时报提到,Mythos 声称可以找到并利用软件中隐藏的缺陷。正因为太强了,发布才需要格外谨慎,Anthropic 说 Mythos 级别模型在公开发布前需要更强的网络安全防护措施,他们在这方面正取得快速进展。
Opus 4.8 的系统卡里有一个细节让人对 Mythos 既期待又警惕:对齐团队说 Opus 4.8 的不对齐行为比率与 Claude Mythos Preview 相似,后者是他们目前对齐水平最好的模型。这意味着 Mythos 不仅能力更强,安全性也在很高的水平上。
TechCrunch 分析,Mythos 预览期可能很快结束,防护措施完成后就会向所有客户开放。Axios 也确认了这个时间表。
如果时间表兑现,几周后我们讨论的将不再是 Opus 4.8 在哪个基准上赢了几分,而是一个能自主发现零日漏洞的 AI 系统被交到所有客户手里意味着什么。
Anthropic 还在预告两条路线:近期推出能以更低成本提供许多 Opus 功能的模型;远期 Mythos 级别代表比 Opus 更高的智能层级。两线并进,一头打性价比,一头打能力天花板。
从 Opus 4.8 到 650 亿美元融资,再到 Mythos 即将出笼,Anthropic 在一天内传递了一个信号:这家曾经活在 OpenAI 阴影下的公司,不想再只当追赶者了。至于能不能坐稳,接下来几周 Mythos 的亮相会给出第一个答案。

