百度曦灵数字人平台降至199元,大模型“全网最低”之战是否还会持续?

  封面新闻记者孟梅易弋力

  9 月 25 日,2024 百度云智大会在北京召开。为帮助企业更快、更好、更省地使用大模型,百度智能云分别针对算力、模型、AI 应用,全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0 两大 AI 基础设施,并升级代码助手、智能客服、数字人三大 AI 原生应用产品。

  其中,新升级的曦灵数字人 4.0 支持根据文字快速生成不同妆造、不同行业特色的 3D 数字人形象和视频,并将 3D 超写实数字人的价格从万元大幅降价至 199 元,达到业内最低价。这一举动无疑将重塑行业格局,令数字人技术的普及前景更加广阔。

  百度集团执行副总裁、百度智能云事业群总裁沈抖表示,过去的一年,是大模型从技术变革走向产业变革的关键一年。而大模型与云计算紧密结合,正在成为新型的基础设施。在历史上这样大范围的基础设施的升级并不多,但每次都会带来生产力的巨大跃迁。而且一次比一次速度更快、影响更大。

  “过去一年,我们感受到客户的模型训练需求猛增,需要的集群规模也越来越大,与此同时,大家对模型推理成本的持续下降的预期也越来越高。这些都对 GPU 管理的稳定性和有效性提出了更高要求。为此,我们对百舸做了大幅升级!”沈抖称。

  为了解决算力资源短缺的问题,百舸 4.0 对“多芯混训”能力进行了重点升级,实现了在万卡规模集群上 95% 的多芯混合训练效能;能够实现工具层面的秒级部署,将万卡集群运行准备时间从数周最快缩减至 1 小时;升级了故障检测手段和自动容错机制,可以有效降低故障发生频次,大幅减少集群故障处置时间,在万卡集群上实现了超过 99.5% 的有效训练时长;长文本推理效率提升了 1 倍以上。

  此外,会上同时宣布,千帆大模型平台升级到 3.0 版本,全面升级了企业级 RAG 和企业级 Agent 开发,还发布了低代码 AI 应用开发平台“AI 速搭”,实现一句话创建 AI 应用。

  沈抖表示,“2024 年大模型的产业落地正在加速,目前在千帆大模型平台上,文心大模型日均调用量超过 7 亿次,累计帮助用户精调了 3 万个大模型,开发出 70 多万个企业级应用。过去一年,文心旗舰大模型降价幅度超过 90%,主力模型全面免费,最大限度降低了企业创新试错的成本。”

  今年 5 月,国内大模型市场已经掀起了一轮降价潮,多家企业纷纷跟进。阿里云、百度、腾讯等头部企业通过大幅降价吸引用户,进一步推动了 AI 大模型的普及和应用。

  那么,大模型的降价潮是否会持续下去?

  业内人士分析称,大模型技术取得突飞猛进的发展,为降价提供了坚实基础。模型训练效率的提升、硬件资源的优化使用以及算法的不断改进,共同推动了成本的倍数级降低。随着技术的日益成熟,大模型应用的门槛也将不断降低,为更多企业和个人用户带来机遇。