国思软件 - Soul App公布自研多模态大模型最新进展

　　来源：环球网

　　环球网科技报道记者李文瑶

　　10 月 16 日消息，在迪拜举办的 GITEX GLOBAL 海湾信息技术博览会上，新型社交平台 Soul App 对外展示最新自研多模态大模型。据了解，该模型具备多模态理解、真实拟人、文字对话、语音通话、多语种等特性。用户可以通过数字装置，即时生成 3D 虚拟数字分身，通过实时动作捕捉与还原，体验自然、流畅、沉浸式的多模态互动。

　　Soul App 方面表示，在现阶段，Soul 3D 虚拟人能力已经实现全面升级，形成了成熟的集成 3D 虚拟人能力的多模态 AI 交互方案——即集合文字、语音、动作交互的多模态大模型方向，实现更接近人类模式的互动体验和更高效、自然、丰富维度的信息传递。

　　目前，Soul 已先后上线了自研语言大模型 Soul X，以及语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等语音大模型能力。今年 6 月，Soul 还在社交行业中较早推出了自研端到端全双工语音通话大模型，具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点，能够直接理解丰富的声音世界，支持超拟人化的多风格语言，实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。

　　接下来，通过最新集成的 3D 虚拟人能力和多模态端到端大模型的 AI 交互方案，Soul 用户自主打造的 3D 虚拟人，可以作为数字世界的多模态全能助手，在平台群聊派对、瞬间广场等丰富社交场景中全面赋能用户的关系发现、建立、沉淀环节，拓展新关系的同时，提供高质量、趣味性、沉浸式的人机交互体验，反馈真实、自然的情感陪伴。

　　Soul App CTO 陶明表示：“作为天然的流量聚集地和交互入口，社交被视为 AI 率先落地的最佳场景之一。我们将围绕用户的实际社交需求和具体社交场景，持续加大对 AI 技术的投入，给用户带来长期的可持续的价值。预计今年年底，Soul 多模态端到端大模型将再次升级，推出全双工视频通话能力，让用户可以真正便捷、自然地体验到包括文字、语音、视觉在内的多模态创新交互。”

Soul App公布自研多模态大模型最新进展

我们的产品

相关链接

关于我们

联系我们