Cyber天花板被打穿!AISI实测Mythos能力正以4.5月翻倍速冲向ASI

  新智元报道

  编辑:定慧大卫

  英国 AI 安全研究所(AISI)昨天扔下重磅炸弹:Mythos 在模拟企业内网 32 步渗透任务中 10 次过6,GPT-5.5 也跟着 10 次过3,连此前所有模型都没破过的 Cooling Tower 靶场都被首次攻破!更炸的是——Cyber 能力翻倍周期一路压到 4.5 个月,瓶颈不是智力,是 Token。这场 ASI 决赛,人类评测已经追不上 AI 了。

  AI 模型的网络攻防能力发展有多快?

  昨天,英国 AI 安全研究所(AISI)发了一篇博客。

  他们实测了 Anthropic 的 Mythos 和 OpenAI 的 GPT-5.5。

  发现这些模型的网络攻防能力4. 5 月就能翻一倍,加速冲向 ASI!

  一句话:前沿 AI 模型的自主网络攻击能力正在超级加速,翻倍周期已经从几年、几个月压到 4.5 个月。

  实际上,我们离想象中的天网并不遥远。

  Anthropic 的前沿红队负责人 Logan Graham 也指出:

  Claude Mythos 预览版在自主网络安全能力上实现了阶跃式突破。

  我们需要迅速为具备这种能力水平的模型世界做好准备

  上一次这个数字还是 8 个月,那是 2025 年 11 月的估算。

  到 2026 年 2 月,缩到 4.7 个月。

  现在 Mythos 和 GPT-5.5 的成绩一出,AISI 自己都表示:

  不确定这是一次性的跳跃,还是一条更陡的新趋势线。

  翻译成人话:他们也不知道 AI 还会不会继续加速。

  32 步渗透,Mythos 十次过六

  AISI 用了一套分层测试体系

  窄域网络安全套件(narrow cyber suite)覆盖逆向工程和 Web 漏洞利用,单任务上限 12 小时,每次调用限制 2.5M Token。

  但真正炸场的是两个模拟企业内网的攻防靶场。

  第一个叫 The Last Ones。

  32 个步骤,模拟一次完整的企业内网渗透链,从初始突破到横向移动到最终目标。

  AISI 估算,一个人类安全专家走完全流程大约需要 20 小时。

  Mythos Preview,10 次尝试,成功 6 次。

  GPT-5.5,10 次尝试,成功 3 次。

  第二个靶场叫 Cooling Tower。

  之前所有模型都没通过。

  Mythos 是第一个破关的,10 次尝试成功 3 次。

  这不是论文里的理论推演。

  这是一个已经部署上线的模型,在模拟真实企业环境里,独立完成了人类安全专家级别的渗透任务。

  Glasswing 项目负责人 Logan Graham 确认,测试用的这个 Mythos checkpoint,就是一个月前随 Project Glasswing 上线的版本。

  外界现在看到的攻防能力,不是实验室里的原型,是正在跑着的生产模型。

  就在你的 Claude APP 里。

  看下实验结果。

  下图上有两条红色虚线(dotted),标着 best attempt(最上面)。

  那是 Mythos Preview (new) 和 GPT-5.5-Cyber 在 10 次尝试里跑出来的最佳单次成绩。

  这条虚线一路冲到了纵轴顶部——32 步,封顶。

  也就是说:在最好的那一次尝试里,Mythos 完整打穿了整条 32 步渗透链——从初始侦察,到完全网络接管。

  4. 5 个月翻一倍,METR 交叉验证

  AISI 算翻倍周期的方法不复杂。

  他们测量的是 80% 可靠性网络时间跨度——模型能以 80% 的成功率独立完成的最长网络任务时长。

  把历史上多个模型的成绩画到时间轴上,拟合指数曲线,算出翻倍时间。

  从 2025 年 11 月的 8 个月,到 2026 年 2 月的 4.7 个月。

  Mythos 和 GPT-5.5 的数据点一加进去,曲线又陡了一截。

  独立评估机构 METR 的基准测试给出了交叉验证。

  他们从软件工程任务角度追踪 AI 能力增长,算出的翻倍周期是 4.2 个月(从 o1-preview 算起),如果把 Mythos 也纳入,缩到 4 个月。

  两条完全独立的评估线,在同一个数量级上碰头了。

  AISI 的原话:

  前沿模型能够自主完成的网络任务时长,翻倍周期是以月计的,不是以年计。

  Token 是天花板,不是智力

  这份报告里最让人不安的不是数字本身,是 AISI 对瓶颈的判断。

  窄域测试套件里,每个任务限制 2.5M Token。

  AISI 明确写了:这个上限人为压低了成功率。

  在攻防靶场实验里,Token 上限放到了 100M。

  Mythos 的表现立刻跳了一个台阶

  意思是,当前制约 AI 网络攻击能力的不是算法,不是推理深度,不是智能上限——是 Token 预算。

  给够 Token,模型就能走得更远。

  AISI 自己也承认了测试体系的局限:

  最长任务只有 12 小时,超出这个范围的能力无法衡量;人类基线数据有限;agent 脚手架过于简单,人为约束了模型发挥。

  换句话说,真实能力很可能比测出来的还要高。

  这就是为什么报告的结论用了翻倍而不是接近天花板。

  他们没有看到天花板。

  评测在追,模型在跑

  把 Logan Graham 那句话再拎出来看一遍。

  测试用的 Mythos checkpoint,一个月前就上线了。

  AISI 的评估报告昨天才发。

  这中间隔了整整一个月。

  而在这一个月里,Anthropic 大概率已经迭代了新的 checkpoint。

  当安全评估结果公开的那一刻,被评估的版本已经是旧的了。

  这不是 AISI 一家的困境。

  整个 AI 安全评测领域都在面对同一个结构性问题:

  模型迭代速度正在系统性地超越安全评估周期。

  评估结果发布时,告诉你的是上个月的模型能做到什么。

  它没法告诉你现在的模型能做到什么。

  AISI 在报告里用了一个很谨慎的表述:

  他们不确定Mythos 和 GPT-5.5 的跳跃是孤立的突破还是新的更快趋势

  AI 模型决赛阶段的新变量

  Anthropic 的 Mythos 和 OpenAI 的 GPT-5.5,在网络攻防能力上都展现了指数级增长。

  Mythos 领先一个身位——6/10 vs 3/10,且独家攻破了 Cooling Tower 靶场——但 GPT-5.5 同样在快速追赶。

  双雄在能力层面狂飙,安全治理层面却出现了一个越拉越大的缺口。

  不到半年,4.5 个月就能翻一倍。

  这个速度意味着,到 2026 年底,前沿模型能自主完成的网络任务复杂度,将是现在的 4 到 8 倍。

  当一个 AI 模型能在没有人类干预的情况下,独立完成一个训练有素的安全专家需要 20 小时才能走完的渗透链,全球每一个连着网线的企业都应该重新审视自己的防线。

  AISI 介绍

  AISI 的身份是全球首个国家级前沿 AI 风险评估机构。

  2023 年 11 月 Bletchley 峰会成立,2024 年 05 月, 由 Safety 改名为 Security,隶属英国 DSIT。

  AISI 的主要职能是网络/生化/自主行为/欺骗倾向的独立评估。

  最关键的是,他们能拿到 OpenAI、Anthropic、DeepMind 等顶级模型公司的 pre-deployment 访问权,也就是说,他们是这些最先进模型的第一批访问者。

  ASI,即 Artifical Super Intelligence,超(级)人工智能。

  参考资料:

  https://www.aisi.gov.uk/blog/how-fast-is-autonomous-ai-cyber-capability-advancing