Soul App公布自研多模态大模型最新进展

  来源:环球网

  环球网科技报道记者李文瑶

  10 月 16 日消息,在迪拜举办的 GITEX GLOBAL 海湾信息技术博览会上,新型社交平台 Soul App 对外展示最新自研多模态大模型。据了解,该模型具备多模态理解、真实拟人、文字对话、语音通话、多语种等特性。用户可以通过数字装置,即时生成 3D 虚拟数字分身,通过实时动作捕捉与还原,体验自然、流畅、沉浸式的多模态互动。

  Soul App 方面表示,在现阶段,Soul 3D 虚拟人能力已经实现全面升级,形成了成熟的集成 3D 虚拟人能力的多模态 AI 交互方案——即集合文字、语音、动作交互的多模态大模型方向,实现更接近人类模式的互动体验和更高效、自然、丰富维度的信息传递。

  目前,Soul 已先后上线了自研语言大模型 Soul X,以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。今年 6 月,Soul 还在社交行业中较早推出了自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。

  接下来,通过最新集成的 3D 虚拟人能力和多模态端到端大模型的 AI 交互方案,Soul 用户自主打造的 3D 虚拟人,可以作为数字世界的多模态全能助手,在平台群聊派对、瞬间广场等丰富社交场景中全面赋能用户的关系发现、建立、沉淀环节,拓展新关系的同时,提供高质量、趣味性、沉浸式的人机交互体验,反馈真实、自然的情感陪伴。

  Soul App CTO 陶明表示:“作为天然的流量聚集地和交互入口,社交被视为 AI 率先落地的最佳场景之一。我们将围绕用户的实际社交需求和具体社交场景,持续加大对 AI 技术的投入,给用户带来长期的可持续的价值。预计今年年底,Soul 多模态端到端大模型将再次升级,推出全双工视频通话能力,让用户可以真正便捷、自然地体验到包括文字、语音、视觉在内的多模态创新交互。”