4 月 8 日晚,阶跃星辰发布多模态推理模型 Step-R1-V-Mini,支持图文输入、文字输出,具备强指令遵循能力和复杂图像推理能力,已上线网页端并开放 API 供开发者使用。
据官方介绍,该模型可精准识别图像细节,生成清晰的推理链条。用户上传一张家常菜照片,模型不仅能识别食材和调料,还能给出具体做法与配比,如“虾仁 300g,大葱白 2 根”。
据悉,在多个公开基准评测中,Step-R1-V-Mini 在 MathVision 等视觉推理任务中位列国内第一,兼具图像理解、数学逻辑与代码推理能力。
阶跃星辰此前已推出多模态模型 Step-1V、Step-1.5V,以及语言推理模型 Step-R-mini,并在 LMSYS、OpenCompass 等权威评测中保持领先。
此前,阶跃星辰创始人、CEO 姜大昕曾表示多模态和推理是 Agent 两大必备要素,2025 年该公司将重点发力智能终端 Agent。(袁宁)