阶跃星辰首发「万亿」和「多模」大模型,还与《大闹天宫》跨界联动

  仅仅过去 100 天左右,站在 AGI 风口上的阶跃星辰再次亮出王炸成果。

  在今天揭幕的世界人工智能大会,阶跃星辰宣布对 Step 系列通用大模型家族进行全面升级。

  阶跃星辰一口气连发三款 Step 系列通用大模型新品:Step-2 万亿参数语言大模型正式版、Step-1.5V 多模态大模型、Step-1X 图像生成大模型。

  ▲ APPSO 在现场

  最新发布的 Step-2 万亿参数语言大模型正式版,采用了创新的 MoE 混合专家模型架构。

  同时,基于阶跃星辰行业领先的系统能力,Step-2 大幅提升了训练效率,在数学、逻辑、编程、知识、创作、多轮对话等方面体感全面逼近 GPT-4,企业和开发者可以通过阶跃星辰开放平台申请体验。

  此外,阶跃星辰还公布了其在多模态大模型研发领域的多项进展。

  新升级的 Step-1.5V 千亿参数多模态大模型,在图像感知和理解能力上全面提升,并具备出色的视频理解能力。它能准确地识别视频中的物体、人物和环境,并理解视频的整体氛围与人物情绪。

  在 Step-2 万亿参数大模型的加持下,Step-1.5V 推理能力大幅增强,能根据图像内容进行解答数学题、编写代码、创作诗歌等高级推理任务。

  如果说 Step-1.5V 的发布,标志了阶跃星辰在极短的时间内,实现了从图像理解到视频理解的跨越升级,那么新发布的 Step-1X 图像生成大模型,则代表了阶跃星辰在推动多模态理解和生成统一的技术路线上取得重要进展。

  它采用全链路自研的 DiT(Diffusion Models with transformer)模型架构,支持 600M、2B、8B 三种不同的参数量,能够满足不同场景的需求。

  并且,Step-1X 具备更加强大的语义对齐和指令跟随能力,还针对中国元素和文化进行了深度优化,更具中国风格。这也是 Step-1X 区别于其他模型的重要特色。

  值得一提的是,阶跃星辰也凭借 Step 系列通用大模型的创新,一举斩获 WAIC 2024 SAIL 之星的称号。

  阶跃星辰创始人、CEO 姜大昕博士曾表示:

攀登 AGI 山峰,『万亿参数』和『多模融合』缺一不可。万亿参数规模,是实现 AGI 的基础门槛;多模态大模型,是通向 AGI 的必经之路。

面向未来,我们会继续将模型做大做强,打造超级模型,同时让模型服务于工作和生活,十倍每个人的可能。

  阶跃星辰也在 WAIC 现场展示了面向 C 端用户的自研产品,以及应用落地的最新成果与计划。

  智能助手——「跃问」和 AI 开放世界平台——「冒泡鸭」,是阶跃星辰面向 C 端用户推出的两款自研产品。

  基于 Step 系列通用大模型的强大能力「跃问」能准确地描述和理解图像中的文字、数据、图表等信息,出色地完成内容创作、逻辑推理、数据分析等任务。

  「冒泡鸭」则打造了一个全新的 AI 开放世界。在这里,用户可以探索故事、创作角色,沉浸属于自己的开放世界。

  同时,阶跃星辰与众多合作伙伴达成了深度合作,共同探索面向 C 端用户的创新应用。

  例如,阶跃星辰与上海报业旗下界面财联社达成深度合作,双方围绕 AIGC 财经资讯、智能投研、智能投顾等领域推进大模型的应用落地。


APPSO 在现场

  面向内容创作领域,阶跃星辰联合上海电影在「AI+IP」领域进行创新探索。双方推出了一款《大闹天宫》AI 互动体验——「测测你是哪路神仙」,调用了 Step 系列大模型,融合了图像理解、风格迁移、图像生成、剧情创作等多种能力。

  阶跃星辰还与上海电影结合《葫芦兄弟》的 IP 进行了视频生成能力的展示。此外,阶跃星辰已与中文在线、中国知网等展开合作,共同探索大模型在网络文学、知识服务等领域的创新应用。

  此外,阶跃星辰宣布推出开放平台——「繁星计划」,投入优质资源扶持多模态领域优秀的初创企业与独立开发者团队,共同加速 AI 大模型技术在各类场景的应用落地。

  鲜少有人知道的是,阶跃星辰的名字其实来自于「阶跃函数」。

  这仿佛与上文提到的「Scaling Law」核心理念不谋而合,随着模型规模的不断扩大,其性能也会随之显著提升,也迎来阶跃式进步。

  今日发布的 Step 系列通用大模型新品,对于阶跃星辰而言,只是其探索之路上的一小步,但也是迈向 AGI 之路,以阶跃之力,赴星辰大海的重要一步。

  在今后的国产大模型战场上,或许没有人敢忽视阶跃星辰这个国产大模型黑马了。