
新智元报道
编辑:KingHZ Aeneas
去年营收 1.1 亿的原生影视工作室 Utopai 火起来,又一次彻底刷屏!奥斯卡编剧下场背书,这家公司直接复刻了皮克斯的神话。从剧本到 4K 大片一键直出,AI 视频刚刚完成了一次史诗级升级。
去年,AI 原生影视工作室 Utopai Studios 闷声发大财,年入 1.1 亿美元!
最近,他们又彻底刷屏了X上的科技与影视圈。
就在大多数 AI 视频工具还在卷 5 秒的高清特效,或者单一角色的一致性时,Utopai Studios 直接甩出了一段 3 分钟级的完整影片。
这不仅仅是一段视频,它起承转合的剧情、精准的镜头语言、工业级的剪辑节奏,以及令人头皮发麻的画面张力,无不令人赞叹。
一次生成,3 分钟连贯叙事,4K 分辨率,最多生成 16 个镜头。角色不崩脸,场景不跳变,摄影风格从头到尾一脉相承。
老实说,咱们编辑部早就盯上了这家在硅谷 Mountain View 闷声干大事的公司,传闻他们憋了个大招。这不,终于让我们等到了——今年,他们已经直接下场来做模型了。
现在,Utopai Studios 已经完成了一次史诗级升级!

这段视频不仅在硅谷创始人圈引发了地震,更让好莱坞感受到了降维打击。


业内人士赞叹道:刚刚,AI 视频买入了真正的电影制作领域!


一个X上的七万分大V表示,PAI 这个概念绝对是革命性的。

网友们已经纷纷展开疯狂实测,感受这个颠覆级 AI 工具的顶级魅力。

想象一下,你正在看一场梦寐以求的冰球季后赛。每一次凶悍冲撞、每一次闪电过人,甚至连球员标志性的庆祝动作,都精准击中你的爽点。
从开球到终场,球员不崩脸、场地不跳变。你不再是捕捉高光的旁观者,而是掌控全场的上帝。这种电影级的长叙事,让体育爽文成了现实!
3 分钟视频直出,
首个获得奥斯卡认可的视频 AI
要明白 Utopai Studios 的重大意义,我们得先理解一个核心问题:在 AI 视频生成领域,为什么 3 分钟视频直出很重要?为什么「连贯叙事」如此困难?
想象一下你是一位导演,你拍了一场戏:男主角穿着蓝色衬衫走进咖啡馆;切到下一个镜头,他坐在桌前,衬衫变成了灰色;再切回来,他的发型都换了。
这就会显得很假,观众会疑惑:你是在拍平行宇宙?
而这,恰恰就是之前绝大多数 AI 视频工具的日常:每一次生成,模型都要从零开始。
它不记得上一个镜头里那个角色长什么样,不记得场景的光线从哪个方向来,更不记得镜头语言应该保持什么样的节奏和风格。
它们当然可以生成一个 5 秒的酷炫片段,但要让它们维持 3 分钟的视觉连贯性,就像让金鱼记住整个剧本一样,根本不成立。
这也是为什么,整个行业一直在炫技,但距离实用还有巨大的鸿沟。
而 PAI 的这次更新,本质上就是在向这个维度发起冲击,甚至拿到了一个份量极重的背书——奥斯卡获奖编剧 Roger Avary 的公开站台。
他在X上转发了 Utopai 的视频,称赞道:「Utopai Studios 刚刚实现了跨越式突破,能够生成长达三分钟、且具备极高一致性控制的电影级长片。」
这个评价的含金量,实在不容小觑。

Roger Avary 是谁?
他是奥斯卡最佳原创剧本奖得主,是昆汀·塔伦蒂诺的黄金搭档,是影史神作《低俗小说》的幕后推手。
后者直接改变了全世界的电影叙事语言,让他和昆汀·塔伦蒂诺一起拿到了那座小金人。

1994 年,Roger Avary 获奥斯卡最佳原创剧本奖
除此之外,他还编剧了《贝奥武夫》、导演了邪典经典《杀手乱弹》,是好莱坞最具影响力的编剧和导演之一。
最近一年,Avary 因为积极拥抱 AI 电影制作而成为行业焦点。

就是这位对电影质感有着近乎偏执要求的教父级人物,公开为 PAI 的一致性控制能力点赞。
要知道,一致性正是 AI 视频生成领域最核心也是最难攻克的问题。
在不同镜头间,一个角色保持同一张脸、同一件衣服、同一种气质,在传统电影中天经地义,因为那是真人演员。但对 AI 来说,简直是地狱级难度。
作为一个每天都在和叙事打交道的专业创作者,Avary 能感受到的「一致性突破」意味着什么?
意味着 PAI 已经不止是做 demo,而是真正具备叙事能力,以及进入真实场景的生产级交付。
这也是历史上第一个获得奥斯卡级创作者公开站台的AI视频工具。这释放了一个强烈的信号:AI 已经通过了专业电影人的「图灵测试」。
在此之前,好莱坞顶级创作者对 AI 视频的态度一直是复杂的——好奇,但保持距离;感兴趣,但不愿公开背书。
Avary 的站台,打破了这层无形的天花板。它向整个行业发出了一个信号:AI 电影制作不再是极客的玩具,它已经准备好进入专业创作者的工具箱了。
实测:让奥斯克编剧盛赞的 AI 视频,
名副其实
在 PAI 平台上,我们展开了一波深度实测。

你可以上传自己的剧本,或者对于影片 idea 的简要构思,还能上传 10 张角色参考图。
然后,PAI 会自动识别每个角色、场景和镜头,生成后,如果镜头直接有连贯性问题,它还会自己标记出来。

而且渲染完成后,我们还能用自然语言自己编辑视频。
甚至,我们还能从视频片段中提取面部表情,微调每个动作,做到逐帧控制。

Utopai 生成的这段视频,效果简直绝了。镜头推拉摇移间,完全是顶级大片的电影质感。
无论是光影斑驳的户外庄园,还是细节拉满的豪宅内部,都真实到让人屏息。人物神态自然,景深虚化更是深得电影摄影精髓。
一眼看上去,仿佛是哪位好莱坞名导执镜的实拍大片,AI 的一致性和工业级渲染,这次真的把虚实边界彻底干碎了。
而且,NBA 巨星詹姆斯·哈登也下场了!

他联手 Utopai Studios,用 PAI 捣鼓出了一部关于自己「招牌胡须」的动画短片。

从球场 MVP 变身 AI 制片人,哈登直言「在 PAI 上搞创作太上瘾」。
当全球最顶级的个人 IP 遇上能保持「一致性」的电影级 AI,这意味着明星营销已不再局限于拍广告,每个人都能在指尖快速构建属于自己的超级英雄宇宙。
这个视频获得了社区的盛赞。
哈登表示,自己非常喜欢在 PAI 上鼓捣各种视频,前不久就用 Utopai Studios 完成了第一支视频,现在很快又携手拍摄了第二支。

全链路管线:被对标皮克斯的底层逻辑
说到 PAI 和 Utopai Studios 的技术路线,就不得不提一个在硅谷科技圈引发热议的类比——皮克斯。
没错,就是那个做出《玩具总动员》《寻梦环游记》《头脑特工队》的传奇工厂。

硅谷著名科技账号 Founders Mode 直接将 Utopai Studios 对标皮克斯的技术路线。

他的核心论点是:
在创意产业中,控制完整的生产基础设施远比单纯拥有创作工具或内容能力更具决定性优势。
而 Utopai Studios 将是 AI 时代的皮克斯 Pixar。
这个类比可以说是十分精准。
1986 年,Steve Jobs 花了 500 万美元从乔治·卢卡斯手里买下了一个叫 Graphics Group 的小团队,这就是后来的皮克斯 Pixar。


早期,皮克斯自研了一套叫 RenderMan 的渲染引擎。
当时,业内多数人都觉得这是「画蛇添足」——
在那个年代,好莱坞的动画制作依赖的是各种分散的工具和手工流程。
皮克斯选择从底层开始,搭建一套完整的、从概念设计到最终渲染的全链路技术管线。
结果,在 1995 年,《玩具总动员》横空出世,成为人类历史上第一部全电脑动画长片。

皮克斯用一套自研的技术栈,硬生生开辟出了一个全新的电影品类。
Utopai Studios 走的,是一模一样的路。
PAI 这次更新的全貌,是这样的。
故事开发阶段——你可以直接上传剧本(或者用自然语言跟 AI Agent 对话描述你的故事),PAI 会自动解析叙事结构,提取角色、场景、情绪节拍,生成制作级的分镜脚本,真正理解故事。
角色设计阶段——每个角色会获得一个持久化的视觉身份,锚定在你的剧本语境中。你可以用自然语言微调、用参考图修改、甚至用 inpainting 精细调整,直到角色完全符合你脑中的样子。更关键的是,这个角色在后续保持同一张脸,同一种风格。
多镜头生成阶段——PAI 可以一次性生成最多 16 个镜头的连贯序列,支持多种画面比例、分辨率(最高 4K)和输出格式,从竖屏社交内容到宽银幕电影级画面,全部涵盖。
多轮编辑阶段——这可能是最被低估的杀手级特性。你可以在任意一个环节回退、修改、微调,然后继续推进故事。这就像在和一个永远不会疲倦、永远不会闹情绪的数字剪辑师合作。
资产管理与导出——最终,所有场景会被组合成一个完整的叙事剪辑,可以直接导出为 Premiere Pro、DaVinci Resolve、ProRes 等专业格式。
从剧本到角色,从分镜到生成,从剪辑到导出——一条管线,全部打通。
这就是为什么 Founders Mode 会把 Utopai 对标皮克斯。
因为在 AI 视频领域,绝大多数公司还在做「一把锤子」——给你一个视频 AI 生成模型,剩下的你自己拼凑去吧。
而 Utopai 做的是「一整个工厂」——从故事的第一个字到最终 4K 影片的最后一帧,全程都在一个系统里完成。
用 Utopai 联合创始人兼 CTO Jie Yang 的话说:
AI 在媒体领域的下一阶段,不会由孤立的工具来定义,而是由能够承载故事、连续性和协作的系统来定义。
我们正目睹一个新时代的开端
PAI 最新版本正式上线,标志着一个重要的转折:AI 视频生成技术,第一次从「单镜头炫技」真正走向了「连贯叙事制作」。
从 3 秒到 3 分钟,看起来只是时长的增加。但背后是一整套从故事理解、角色一致性、多镜头连贯、迭代编辑到专业导出的端到端能力的质变。
就像当年 YouTube 的出现没有杀死电影,但彻底改变了内容创作的格局。AI 视频工具不会取代导演和编剧,但它们正在重新定义「谁可以拍电影」这个问题的答案。
Utopai Studios 的 PAI,不是最早的 AI 视频工具,也不是画面最炫的。但它可能是第一个真正理解「做电影不是做特效片段」的 AI 平台。
一套管线,一个工厂,一个让故事变成影像的完整系统。
当皮克斯在 1986 年开始自研 RenderMan 的时候,没有人能预见到 9 年后那个会说话的牛仔玩具会征服全世界。
而今天,当 Utopai 在硅谷默默搭建 AI 电影制作的全链路管线时,我们同样无法完全预见它最终会带来什么。
但有一点已经很清楚了——
这一次,UTOPAI 真正打开了 AI 电影制作的大门。
参考资料:
https://x.com/UtopaiStudios/status/2044895189949415793?s=20
https://x.com/UtopaiStudios/status/2044819663217996034?s=20
https://x.com/BrentLynch/status/2044585944742084730?s=20
https://x.com/animag/status/2042334610428682358?s=20
