国思软件 - 百度领投多模态大模型，生数科技完成数亿元Pre-A轮融资

　　图片系 AI 生成

　　钛媒体 App 6 月 5 日消息，生数科技完成数亿元 Pre-A 轮融资，本轮融资由百度、北京市人工智能产业投资基金领投，中关村科学城公司、启明创投等跟投。

　　据悉，本轮融资完成后，生数科技将坚持其原生通用多模态技术路线，持续迭代优化自研大模型，并加速产品开发与市场拓展。此前，生数科技已经获得来自蚂蚁集团、BV 百度风投、卓源亚洲、锦秋基金、达泰资本、智谱 AI 等机构的投资。

　　生数科技作为国内最早布局多模态通用大模型的团队之一，今年 4 月联合清华大学发布了国内首款全面对标 OpenAI Sora 的视频大模型 Vidu。未来，生数科技将基于百度百舸·AI 异构算力平台持续训练、提升模型能力，并逐步通过百度智能云千帆平台开放模型服务。

　　百度集团执行副总裁、百度智能云事业群总裁沈抖表示，投资生数科技是百度在多模态大模型领域的重要战略布局。未来，百度将发挥自身在 AI 异构算力、大模型平台、生态等方面的独特优势，帮助生数科技加速技术研究与创新，快速打通商业成功路径，共同做大产业“蛋糕”。

　　据了解，生数科技核心团队来自多个海内外顶级学术机构和科技企业，早在 2021 年就率先开始了扩散模型研究，是国内最早研究深度生成模型的团队之一。其提出的免训练推断算法 Analytic-DPM、全球最快采样算法 DPM-Solver，被 Stable Diffusion、DALL·E 2 等图像模型采用，

　　2022 年，生数科技提出全球首个 Diffusion 与 Transformer 融合架构U-ViT，并在半年后再次取得重大突破，开源全球首个基于此融合架构的多模态扩散模型 UniDiffuser，成功验证了大规模训练融合架构的可行性与涌现能力。自成立以来，生数科技就坚持采用U-ViT 融合架构处理多模态数据，持续探索大模型在图像、3D、视频等多模态生成任务下的性能边界。

　　2024 年初，OpenAI 推出视频大模型 Sora，其背后采用的融合架构 Diffusion Transformer 和原生多模态技术路线引发关注，而彼时生数科技对该技术路线的布局已持续超过一年。今年 4 月，生数科技联合清华大学正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu，性能全面对标 Sora，在国内外引发广泛关注。

　　Vidu 支持一键生成 16 秒、分辨率 1080P 的高清视频内容。Vidu 不仅能够模拟真实物理世界，还拥有丰富想象力，具备多镜头生成、时空一致性高等特点，性能全面对标国际顶尖水平。这也是 Sora 发布以来，多模态大模型领域在全球范围内的又一重大技术突破。

　　此外在商业化进程上，生数科技从已陆续推出视觉创意设计平台 PixWeaver、3D 资产构建工具 VoxCraft 两款应用产品，同时携手多家合作伙伴，将多模态大模型应用于游戏、影视、文旅、智能终端等场景。

　　百度副总裁陈一凡表示，百度百舸针对大模型训练、推理等任务，对智算集群进行了全面优化，实现了业界领先的算力效能，结合千帆平台提供的大模型全流程工具链，能够支持生数科技开发出最好的多模态大模型。

　　“未来，我们还将继续支持生数科技，以及更多优秀的大模型基于百舸、千帆进行模型训练和迭代，共同发掘大模型在更多场景中的应用潜力，深度赋能政务、交通、能源、制造、金融等行业，为中国实体经济高速发展贡献科技力量。”陈一凡说。

百度领投多模态大模型，生数科技完成数亿元Pre-A轮融资

我们的产品

相关链接

关于我们

联系我们