
新智元报道
编辑:桃子好困
今天,谷歌原生视频模型 Gemini Omni 意外曝光!各种惊艳 demo 刷爆,教授黑板推导数学公式、一句话编辑视频,丝滑程度让全网破防。
谷歌I/O大会开幕在即,原生 Gemini 提前曝光!
如今,全网都被这个视频刷爆了——一位教授在台上一边讲课,一边在黑板上随手推导公式,这质感、丝滑度,堪称惊艳。
实际上,这是由「全新视频模型」Gemini Omni 生成,连贯性、一致性直接拉满。
有网友惊叹道,视频版 Nano Banana 来了!

还有人表示,眼见为实已经不存在了。

原生 Gemini Omni,首次曝光了

就在昨天,Gemini 移动端 App 主页截图流出,一个全新视频模型 Gemini Omni 入口上线。
界面中,赫然写着——快来认识一下我们全新的视频生成模型。重新混剪你的视频,直接在对话中编辑,尝试模板。
显然,谷歌以全新形式带来了 Gemini Omni!

这可能是一个全模态的 Gemini,同时支持文本、图像、音频、视频输入和输出。
与 Veo 不同的是,Omni 将像 Nano Banana 一样深度集成到 Gemini 中,具备更出色的提示理解与推理能力。
尤其是,在实时视频编辑上,可以一键物体替换,去除水印。

与此同时,Omni 模型的 ID 也被同时爆出——
fbard_eac_video_generation_omni /bard/v3smm-lora-prod.goat-cr-rev6-xm171555416-at-1200
可见,Omni 生成的视频支持 10s 时长,分辨率 1280x720。

真正让全网陷入疯狂的是,几个提前测试放出的 demo。
教授黑板推公式,全网震惊

最炸裂的那个一,便是开篇「教授在黑板上推导三角恒等式」的视频。
画面中,教授手持粉笔在黑板上一步一步写下数学证明,同时用口语同步讲解当前推导步骤。

懂行的人看到这会直接跳起来。在 AI 生成视频里把数学公式写对,这件事有多难?
文本一致性一直是视频生成模型的「阿喀琉斯之踵」。
此前,Sora 生成的文字经常是看着像字,但仔细一看全是「鬼画符」的状态,更别提完整的数学推导了。

而 Omni 的这段 demo,公式是对的,推导是连贯的,笔迹是自然的。
更难以想象的是,这个惊艳的 demo,仅用了一句提示词——
A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.
许多人看完,直接破防!
不得不说,AI 视频生成已跨越「恐怖谷」,正式进入超写实时代。



还有灰度到的网友,也做了一批类似的视频,个个都好到爆。
真正的杀手锏:实时编辑

Gemini Omni 强大之处不止于生成,这一次,「实时编辑」也实现了大幅跨越。
泄露的演示中,Omni 展现了令人瞠目的编辑能力——
-
一键去水印:Omni 可以直接对话去水印,且画面毫无破绽;
-
物体替换: 动动嘴,视频中的物体就被精准替换,光影、遮挡关系全部自动适配;

如下 demo 中,上面是原视频,仅需一句话把意大利面换成「奶油浓汤」,瞬间完成。
再比如,上传一个 Sora 之前生成的视频,Gemini Omni 可以直接去除水印。


有人对此表示,仅是去水印这一点,足以让这一工具成为创作者的游戏规则改变者。

不仅如此,Gemini Omni 还可以支持风格化输出。
下面这个动漫风格的视频,蓝色火焰特效、打斗动作线条,每一帧都像是专业动画师手绘的。
不过早期测试显示,Gemini Omni 额度消耗非常快。

谷歌杀回,Sora 2 却关停了
Gemini Omni 泄露的时间点,堪称「精准卡位」。
就在两周前——4 月 26 日,OpenAI 的 Sora App 正式停服。
这个曾经让全世界为之疯狂的 AI 视频生成器,走完了它短暂而戏剧化的一生。

回顾一下 Sora 的死因,简直是一部商业悲剧:
烧钱速度惊人,据称,Sora 的推理成本高达每天 100 万到 1500 万美元。视频生成比文本和图像生成贵了不止一个量级,而这个成本始终没降下来。

最关键的是,OpenAI 留不住用户。峰值约 100 万活跃用户,到停服前已跌破 50 万,30 天留存率不到8%。
整个生命周期的应用内收入仅约210 万美元,连一天的算力费都覆盖不了。
3 月 24 日,Sora 官方账号在X上发出那句著名的告别,「We're saying goodbye to the Sora app」。
API 将在 9 月 24 日彻底关闭,一个时代结束了。

谷歌I/O 2026 将在 5 月 19 日开幕,Gemini Omni 极有可能在主舞台上正式亮相。
AI 视频赛道,又要变天了。
有网友将 Omni 生成的视频,和 Sora 2 做了一个直观对比,效果简直差出好几个量级。


动漫打斗场景中,Gemini Omini 丝滑到炸裂,Sora 特效却一团乱麻。


I/O倒计时,谷歌摊牌
除了 Omni,谷歌多款尚未正式发布的 Gemini「全线模型」被意外推送到生产环境 API 中。
此次泄露的模型阵容极其豪华,包括 Gemini 3 Flash、3.1 全系列(Pro、Flash Image、Lite、TTS),以及专注于高保真音频生成的 Lyria 3 Pro。
最重磅的是,谷歌即将推出的「Omni」原生多模态视频模型,将针对所有的核心模型推出专门的 Agent 版本。

I/O主舞台,谷歌要摊牌了!
参考资料:
https://x.com/chetaslua/status/2053824398503678108?s=20
https://x.com/testingcatalog/status/2053857806374064496?s=20
https://x.com/Waguri_Kaoruko8/status/2053818116237353039?s=20
https://www.reddit.com/r/singularity/comments/1ta99ss/upcoming_leaked_gemini_omni_vs_nearly_shutting/
