5 月 29 日消息,阶跃星辰发布并开源 Step 3.7 Flash 模型。
据介绍,Step 3.7 Flash 是一款面向生产级 Agent 场景设计的基础模型,重点提升模型在执行效率、工具调用、复杂任务处理及多轮工作流中的稳定性。
阶跃星辰表示,随着 Agent 逐步进入企业生产环境,模型能力评价标准正从单纯追求智能水平转向兼顾效率、可靠性与规模化部署能力。Step 3.7 Flash 旨在满足这一需求。
根据官方披露的信息,该模型采用稀疏 MoE 架构,总参数规模为 196B+1.8B(ViT),激活参数约 11B,最高生成速度可达 400 Tokens/s。
在能力方面,Step 3.7 Flash 支持原生多模态理解,可处理图表、文档、图片及应用界面等内容,并能够将视觉信息转化为结构化结果和执行任务。同时,模型支持联网搜索与视觉搜索能力,可在信息不足时主动检索相关内容。
针对 Agent 应用中的工具调用需求,阶跃星辰称,该模型对 API、浏览器、终端及 Office 工具等调用能力进行了优化,以提升长流程任务中的执行稳定性。

基准测试显示,Step 3.7 Flash 在 SimpleVQA (Search)、V* (Python) 等复杂视觉任务 Benchmark 上,展现出媲美更大规模旗舰模型的能力表现。而在考察多工具协同的 Toolathlon 上,这款模型的分值达到了 49.5%,并在考察真实环境下日常自主任务执行的 ClawEval-1.1 上达到了 67.1%;在横跨 44 种职业的 GDPval 上达到了 45.8%;在 τ²-bench Telecom 的低、中、高三档推理难度下通过率均达到 98% 以上。
此外,Step 3.7 Flash 还兼容 Claude Code、OpenClaw、Hermes Agent 等主流 Agent 开发工具,并支持云端及本地部署。
阶跃星辰表示,后续将围绕 Step 3.7 Flash 推出生态共建计划,并与开发者共同探索 Agent 应用的工程实践与生产化路径。(定西)
