可灵AI发布 3.0 版本:视频与图片能力全面升级

  <插入视频号:可灵 AI>

  昨天,可灵 AI 官宣正式迈入「3.0 时代」,围绕视频与图片两大核心能力进行全面升级,重点提升叙事能力、可控性、一致性与画质表现,并首次引入多模态一体化的原生创作流程。

  可灵 AI 表示,本次更新覆盖从生成到编辑的完整链路,旨在让创作者以更低门槛获得电影级叙事体验。更新内容包括视频 3.0、视频 3.0 Omni、图片 3.0、图片 3.0 Omni 四大模块。

  可灵视频 3.0:

  • 智能分镜功能可自动理解剧本并调度景别与机位,减少单镜头堆叠带来的叙事限制;
  • 图生视频能力新增主体参考,可通过多图或视频锚定角色、道具与场景特征,降低生成偏移;
  • 全能音画功能支持多语种与多方言口型同步,提升角色演绎自然度;
  • 文字生成部分强化字形保真,适用于广告、字幕等高精度场景;
  • 视频生成时长扩展至 3-15 秒,使复杂叙事得以一镜完成。

  视频 3.0 Omni:

  • 全能参考 3.0 在主体相似度与复杂文本执行上均有明显提升;
  • 全能主体 3.0 支持上传 3-8 秒角色视频提取人物特征与原声音色,并可为多图主体绑定专属声线;
  • 分镜叙事 3.0 新增原生自定义分镜与最长 15 秒自由时长控制,支持像素级修改。

  图片 3.0 Omni:

  • 引入影视级光影重构,可清晰解析提示词中的视听元素,满足专业创作需求;
  • 组图创作支持批量调整与风格统一,适合系列视觉内容生产;
  • 原生 2K/4K 输出无需二次放大,画面细节更丰富;质感进阶功能提升真实感与细节稳定性。

  图片 3.0 模型:

  • 最多支持 10 张参考图,能精准锁定核心元素与色调;
  • 多参考图模式融合风格转绘、人像参考等能力,无需切换功能即可编辑元素;
  • 整体画面在真实感、色调与细节上均有提升。

  可灵 AI 表示,本次 3.0 版本的目标是让用户以更自然的方式进行原生创作,覆盖从灵感到成片的完整流程。部分功能已向黑金会员开放超前体验,更多能力将在今年持续上线。