可灵AI发布 3.0 版本：视频与图片能力全面升级

　　<插入视频号：可灵 AI>

　　昨天，可灵 AI 官宣正式迈入「3.0 时代」，围绕视频与图片两大核心能力进行全面升级，重点提升叙事能力、可控性、一致性与画质表现，并首次引入多模态一体化的原生创作流程。

　　可灵 AI 表示，本次更新覆盖从生成到编辑的完整链路，旨在让创作者以更低门槛获得电影级叙事体验。更新内容包括视频 3.0、视频 3.0 Omni、图片 3.0、图片 3.0 Omni 四大模块。

　　可灵视频 3.0：

智能分镜功能可自动理解剧本并调度景别与机位，减少单镜头堆叠带来的叙事限制；
图生视频能力新增主体参考，可通过多图或视频锚定角色、道具与场景特征，降低生成偏移；
全能音画功能支持多语种与多方言口型同步，提升角色演绎自然度；
文字生成部分强化字形保真，适用于广告、字幕等高精度场景；
视频生成时长扩展至 3-15 秒，使复杂叙事得以一镜完成。

　　视频 3.0 Omni：

全能参考 3.0 在主体相似度与复杂文本执行上均有明显提升；
全能主体 3.0 支持上传 3-8 秒角色视频提取人物特征与原声音色，并可为多图主体绑定专属声线；
分镜叙事 3.0 新增原生自定义分镜与最长 15 秒自由时长控制，支持像素级修改。

　　图片 3.0 Omni：

引入影视级光影重构，可清晰解析提示词中的视听元素，满足专业创作需求；
组图创作支持批量调整与风格统一，适合系列视觉内容生产；
原生 2K/4K 输出无需二次放大，画面细节更丰富；质感进阶功能提升真实感与细节稳定性。

　　图片 3.0 模型：

最多支持 10 张参考图，能精准锁定核心元素与色调；
多参考图模式融合风格转绘、人像参考等能力，无需切换功能即可编辑元素；
整体画面在真实感、色调与细节上均有提升。

　　可灵 AI 表示，本次 3.0 版本的目标是让用户以更自然的方式进行原生创作，覆盖从灵感到成片的完整流程。部分功能已向黑金会员开放超前体验，更多能力将在今年持续上线。

作者：itwriter
来源：互联网
日期：2026-02-05
浏览 (3312)