快手文生图大模型可图宣布开源

  在 2024 世界人工智能大会上,快手高级副总裁、主站业务与社区科学负责人盖坤宣布,快手文生图大模型可图(Kolors)正式开源。该模型基于数十亿图文对进行训练,支持 256 的上下文 token 数,支持中英双语,技术细节参考技术报告

  地址:https://github.com/Kwai-Kolors/Kolors

  可图大模型是由快手 AI 团队自研打造的文生图大模型,具备强大的图像生成能力,它基于大语言模型与跨模态模型实现精准的用户意图理解,可以支持古诗词等中文特色的内容理解与生成,并且基于用户反馈持续优化,图像生成效果更贴近大众艺术审美了,支持海量全球艺术风格的生成。

  据悉,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型(可图、可灵)为核心的大模型矩阵。其中,推荐模型 SIM 参数规模已达到十万亿的参数规模,下一代推荐大模型架构 ACT 预估每天可为快手 App 带来 4 亿分钟的时长增长。