4 月 15 日消息,美国时间周二,OpenAI 发布其最新旗舰人工智能模型的变体 GPT-5.4-Cyber。该模型专为防御性网络安全任务进行微调。
就在 4 月 7 日,Anthropic 刚刚推出前沿 AI 模型 Mythos,并在其 Project Glasswing 下进行内测。该计划采取定向邀请制,授权特定机构将 Claude Mythos 预览版应用于网络防御。据悉,Mythos 现已在各大操作系统、浏览器及底层软件中排查出数千个高危漏洞。
针对 GPT-5.4-Cyber 的发布,OpenAI 表示,鉴于该模型的网络操作权限更为宽松,初期将仅向通过审核的安全供应商、机构及研究人员进行定向开放。
该公司在官方声明中指出,正将其“网络安全信任访问”(TAC)计划的覆盖范围,扩大至数千名经身份验证的个人安全专家及数百个负责关键软件安全的团队。OpenAI 为今年 2 月启动的 TAC 计划增设了全新的分级访问机制。通过最高等级审核的用户将获得 GPT-5.4-Cyber 的访问权限,在处理漏洞研究与分析等敏感任务时,其受到的系统限制将显著减少。
据介绍,GPT-5.4-Cyber 放宽了模型针对合法网络安全指令的拒绝边界,并支持二进制逆向工程(Binary Reverse Engineering)等高级防御工作流。该功能允许安全专业人员在无源代码的情况下,分析已编译软件,以探测潜在漏洞及恶意软件风险。
然而,由于模型权限较高,OpenAI 强调将采取有限且迭代的部署方式。在“零数据保留”(ZDR)等缺乏透明度的使用场景中,或通过第三方平台访问时,由于 OpenAI 无法直接监控用户、运行环境及请求意图,该模型的高级权限可能会受到限制。目前,个人用户可通过官网验证身份申请加入 TAC 计划,企业用户则可经由专属代表为其团队申请信任访问权限。
应对能力进化:算力飙升下的防御升级
面对 AI 技术在网络攻防两端的双向应用,OpenAI 重申了其推进网络防御计划的三项核心原则:访问权限普惠化、迭代部署与生态系统韧性。
OpenAI 在声明中特别警示,随着黑客与防御者开始在现有模型上使用更多的“测试时算力”(test-time compute),结合复杂的提示词框架,模型正被激发出越来越强的能力边界。这意味着安全保障措施不能坐等未来的某个单一阈值,而必须与模型能力同步扩展。
在访问权限方面,OpenAI 计划通过“了解你的客户”(KYC)和身份验证等客观标准,决定高级功能的访问归属,以确保合法机构能获取先进防御能力,同时防范技术滥用。在部署策略上,公司将通过实际应用持续更新模型和安全系统,提升模型对抗“越狱”等对抗性攻击的韧性。
根据 OpenAI 的“准备状态框架”,基础版 GPT-5.4 已被评估为具备“高”网络攻防能力评级。回顾其技术路径,该公司自 GPT-5.2 起便引入了针对网络安全的特定训练。为支持防御者生态,OpenAI 此前发布了自动代码审计工具 Codex Security。数据显示,该工具自发布以来,已协助开发者修复逾 3000 个关键及高危漏洞。
展望后续产品,OpenAI 评估认为,现有的安全保障措施足以支撑当前模型的广泛部署。但随着未来 AI 模型能力逐步超越现有的专用工具,业界需要同步构建更为广泛和严密的防御机制。(易句)
(本文由 AI 翻译,网易编辑负责校对)
