作者 | 椒盐玉兔
邮箱 | guojunjing@pingwest.com
这两天,最热闹的莫过于云栖大会了!
阿里前脚发布 Qwen2.5 系列大模型,后脚发布通义万相视频生成模型,可生成影视级高清视频,可应用于影视创作、动画设计、广告设计等领域。
这是一款全自研视觉生成大模型,采用全新的 Diffusion + Transformer 架构,支持图像和视频生成类任务,在模型框架、训练数据、标注方式和产品设计上均有诸多创新,从而提供业界领先的视觉生成能力。
具体使用简单不挑地方,在通义万相官网、通义 APP 都可以使用,非常方便。更重要的是,免费使用,手机随便玩,电脑每天 50 次图像、10 次视频机会。可把我高兴坏了,赶紧就去试试。(姐妹们,赶紧薅羊毛!)
电脑端: 打开网址 https://tongyi.aliyun.com/wanxiang/videoCreation 输入文字或图片,点击生成即可。
手机端: 打开通义 APP,点击频道,找到万相 AI 生视频即可生成。
这几年,中国风元素逐渐走出国门,在全球文化舞台上大放异彩。前段时间的《黑神话·悟空》的游戏画面更是让老外十分震惊。
无论对于创作者还是普通爱好者,想要创作出高质量的中国风视频,往往面临着语言理解、创意匮乏、制作成本高、专业门槛高等诸多挑战。而通义万相的出现,不仅能理解复杂的中文描述,还能将抽象的文化元素具象化,让每个人都能轻松成为中国风视频的创作者。
让我惊喜的是不仅精通中文,更深谙中国文化,我们给 AI 导演的四个创作主题,看看这位 AI 导演能否担起重任!
灵动的水墨锦鲤与会动的《千里江山图》
我们让 AI 生成一张动态的千里江山图,这里主要测试通义万相,对于中文的理解,并生成复杂的人物动作、环境互动和中国传统元素,先来看个文生视频,
提示词:国风,千里江山图,木舟悠然游动,江面水波律动
通义万相相对完美解读了"国风"、"水墨画"等概念,在理解上基本达到了满分,当涉及到“木舟、水面”等多个元素,都能准确呈现。将中国传统绘画的精髓融入创作中。
在千里江山图中,它不仅赋予画面动感的同时,还保留了中国传统绘画的韵味。这种动静结合的美感,可以说是 AI 艺术创作的一大突破。再来个图生视频:一只锦鲤在荷塘里,水墨画。
在语义理解这块,只给一句话,就把锦鲤在水面上的游动、水波的律动刻画地非常生动,甚至鱼的眼睛还在动,这满满的细节,整个动画十分流畅。看来中文长本文理解的加强是实实在在的,同时对中文内容和元素原生支持更好。属实是牛!
既然对语义理解没问题,那我们升级难度,我们将测试通义万相在生成复杂运动效果方面的能力,特别是在中国武侠场景中。这里主要测试通义万相,理解并生成复杂的人物动作、环境互动和中国传统元素。
提示词:竹林飞檐,白衣剑客轻功漫步,竹叶纷飞
特别值得一提的是,通义万相在处理"轻功漫步"这种虚幻的动作时,白衣剑客在竹林间轻盈跃动,体现了 AI 对"轻功"概念的理解。它不仅要理解"轻功"这个中国特有的武侠概念,还要将其可视化,这难度可不亚于教一只企鹅打太极拳!
如果不了解如何写好提示词,可以在产品界面点击“灵感扩写”,将简单提示词自动“扩写”成忠于原意的长提示词,从而大幅度提升生成效果。
扩写之后,提示词更加详细丰富,画面内容也更加有韵味。
提示词:视频展示了在中国风的背景下,一位身着白衣的剑客在竹林间施展轻功漫步的场景。视频中,剑客身形矫健,仿佛踏风而行,穿梭于高耸的竹林之间,每一次落地都轻盈无声。竹叶在剑客的行动中纷飞,如同随风起舞,营造出一种超凡脱俗的意境。飞檐翘角的古典建筑隐约可见,增添了几分古韵。整个画面充满了诗意和动感,让人仿佛置身于古代武侠世界之中。
扩写之后的效果场景上细节很丰富,竹叶随剑客移动而飘动,呈现了良好的环境互动。同时影像风格统一,符合水墨画美学。整体彰显了 AI 在场景理解、文化元素融合方面的进步。
哦,对了,官方与宝石 Gem 合作国风《江雪 MV》,真的蛮惊艳,我很喜欢。
官方与宝石 Gem 合作《江雪 MV》
妥妥的“动感超人”
通义万相视频生成大模型集成了多项创新技术,有效解决画面表现力和大幅度运动等视频生成技术难题。针对运动生成和物理模拟等难点优化算法,实现了大幅度主体运动和运镜控制,并有效模拟真实世界物理特性;设计了高压缩比、高质量视频 VAE 框架,有效降低视频信息冗余,并保持高质量视频重构能力。
我们一起来看看运动效果如何。
提示词:京剧演员在海底剧场翻腾跳跃,彩带与气泡交织飞舞
这个场景的效果我还是蛮惊讶的,彩带在水中飘动,与气泡交织,形成了动态的视觉层次,增添了场景的奇幻感,展现了复杂的流体动力学模拟能力。
AI 成功模拟了水的浮力和阻力对人体运动的影响。京剧演员的翻腾跳跃动作可能显得更加轻盈缓慢,体现了水下运动的特性。
提示词:功夫大师在摩天大楼间飞檐走壁,霓虹灯光随动作闪烁
功夫大师的"飞檐走壁"动作需要精确的重心转移和身体控制。AI 成功模拟了这种高难度动作,包括跳跃、翻转和快速位移。大师的动作流畅自然,体现了通义万相对人体运动力学的准确理解。
而在高楼间穿梭时,AI 准确表现了重力作用和惯性效果。大师在跃起时的加速和落地时的缓冲都符合物理规律,增添了场景的真实感。
人物的下落的效果是很自然的。可能大家也发现了,视频效果中有音效,还非常契合。这一次,通义万相能生成,与视觉内容高度匹配的声音特效,实现音画同步,增强视听一体的沉浸感。
提示词:繁华都市夜景,旗袍女子漫步霓虹街头,古今交融
AI 成功营造出古今交融的氛围,旗袍与都市景观的和谐统一体现了其出色的风格融合算法。霓虹灯下的都市夜景,旗袍女子优雅漫步其中,她的服饰在灯光下呈现动态光泽,传统刺绣与现代灯光相映成趣。场景中流动的行人和交通增添了真实感,展示了模型在复杂动态场景生成方面的进步。
再看一个画面内人物转身较大的效果。
提示词:复古太空通信员,转身操作通信设备,背景是撒哈拉沙漠和金字塔。
这么快的运镜下基本是没有变形的。
提示词:视频展示了一座宏伟的古典建筑,镜头缓缓推进,聚焦于被盛开樱花环绕的建筑。金色的灯光闪烁,给人温暖而梦幻的感觉,前景中的水面如镜子般反射着建筑和花瓣。
水面波光粼粼,镜头推进光影变化效果真实细腻,这不就是我们要真实感吗?说实话,在 AI 物理世界理解这块,通义是我目前使用过做的最好的。
音画同步:AI 导演的配音绝活
说起视频制作,光有好画面还不够,配上合适的音效才能让作品更有感染力。而通义万相在这方面可是有独门绝技——音画同步功能。
还记得我们之前生成的那些动感十足的视频吗?无论是轻功水上漂的武侠高手,还是在霓虹灯下漫步的旗袍美人,通义万相都能为它们配上恰到好处的音效。
提示词:骑着机械龙的未来武士在长城上疾驰,烟火在背景绽放
听,机械马蹄声,龙剑客飞檐走壁时的呼呼风声,甚至是海底京剧时泡泡上浮的咕噜声,每一个细节都被 AI 精准捕捉。这哪是配音,简直就是给视频注入了灵魂!
更厉害的是,通义万相不仅能生成音效,还能创作与画面匹配的背景音乐。比如:
从自然音效到现代感十足的音乐配乐,AI 都能信手拈来。画面动感,音乐就强劲;场景舒缓,旋律就轻柔。这默契度,简直比某些人类导演和配乐师配合得还要好!
通义万相的音画同步功能,不仅大大提升了生成视频的质量,还为创作者省去了找配乐、剪辑音效的麻烦。现在,只需要输入文字或上传图片,通义万相就能一条龙服务,从画面到声音,统统帮你搞定。
这种音画同步的能力,让通义万相生成的视频更具沉浸感和感染力。无论是用于短视频创作、广告制作,还是作为电影前期概念预演,都能让创意更生动、更直观地呈现出来。
看来,通义万相不仅是位"会说中国话"的 AI 导演,还是个"能歌善舞"的全能选手呢!有了这样的神助攻,相信未来会有更多有趣的音视频作品涌现出来。各位创作者,你们心动了吗?
多种风格的融合
除了上面的国风效果,还能融合多种风格,比如写实风格、毛毡动画、CG 厚涂、3D 动漫、勾线动画等风格。请看以下视频:
多种元素、多种风格的融合十分有利于想象力旺盛的创作,很多时候传统影视无法实现的效果,完全可以用 AI 来生成,而通义万相弥补了概念组合、元素结合、以及更强的想象力,想要什么有什么,带来更强的创作能力。
最后
如果给通义这次表现打分,我给满分 100 分中的 90 分!扣的 10 分是因为......well,我们总得给 AI 留点进步空间,对吧?
从动态水墨画到未来武侠,从海底京剧到霓虹旗袍,想要作出中国风的作品是妥妥的没问题。
整体体验下来,通义万相在理解复杂语言、生成物理世界方面很不错,同时在音画同步方面也是一绝。上面我们通过一系列融合传统与现代元素的挑战,通义万相不仅证明了自己是一位"会说中国话"的 AI,更是一个深谙中国文化、能够创新演绎中国风的数字艺术家。期待它未来带来更大的创新!
最后提醒一句,通义万相现在免费,不试白不试!