谷歌全新Gemini Omni首曝,视频版「香蕉」来了!教授黑板推公式全对

  新智元报道

  编辑:桃子好困

  今天,谷歌原生视频模型 Gemini Omni 意外曝光!各种惊艳 demo 刷爆,教授黑板推导数学公式、一句话编辑视频,丝滑程度让全网破防。

  谷歌I/O大会开幕在即,原生 Gemini 提前曝光!

  如今,全网都被这个视频刷爆了——一位教授在台上一边讲课,一边在黑板上随手推导公式,这质感、丝滑度,堪称惊艳。

  实际上,这是由「全新视频模型」Gemini Omni 生成,连贯性、一致性直接拉满。

  有网友惊叹道,视频版 Nano Banana 来了!

  还有人表示,眼见为实已经不存在了。

  原生 Gemini Omni,首次曝光了

  就在昨天,Gemini 移动端 App 主页截图流出,一个全新视频模型 Gemini Omni 入口上线。

  界面中,赫然写着——快来认识一下我们全新的视频生成模型。重新混剪你的视频,直接在对话中编辑,尝试模板。

  显然,谷歌以全新形式带来了 Gemini Omni!

  这可能是一个全模态的 Gemini,同时支持文本、图像、音频、视频输入和输出。

  与 Veo 不同的是,Omni 将像 Nano Banana 一样深度集成到 Gemini 中,具备更出色的提示理解与推理能力。

  尤其是,在实时视频编辑上,可以一键物体替换,去除水印。

  与此同时,Omni 模型的 ID 也被同时爆出——

  fbard_eac_video_generation_omni /bard/v3smm-lora-prod.goat-cr-rev6-xm171555416-at-1200

  可见,Omni 生成的视频支持 10s 时长,分辨率 1280x720。

  真正让全网陷入疯狂的是,几个提前测试放出的 demo。

  教授黑板推公式,全网震惊

  最炸裂的那个一,便是开篇「教授在黑板上推导三角恒等式」的视频。

  画面中,教授手持粉笔在黑板上一步一步写下数学证明,同时用口语同步讲解当前推导步骤。

  懂行的人看到这会直接跳起来。在 AI 生成视频里把数学公式写对,这件事有多难?

  文本一致性一直是视频生成模型的「阿喀琉斯之踵」。

  此前,Sora 生成的文字经常是看着像字,但仔细一看全是「鬼画符」的状态,更别提完整的数学推导了。

  而 Omni 的这段 demo,公式是对的,推导是连贯的,笔迹是自然的。

  更难以想象的是,这个惊艳的 demo,仅用了一句提示词——

  A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.

  许多人看完,直接破防!

  不得不说,AI 视频生成已跨越「恐怖谷」,正式进入超写实时代。

  还有灰度到的网友,也做了一批类似的视频,个个都好到爆。

  真正的杀手锏:实时编辑

  Gemini Omni 强大之处不止于生成,这一次,「实时编辑」也实现了大幅跨越。

  泄露的演示中,Omni 展现了令人瞠目的编辑能力——

  • 一键去水印:Omni 可以直接对话去水印,且画面毫无破绽;

  • 物体替换: 动动嘴,视频中的物体就被精准替换,光影、遮挡关系全部自动适配;

  如下 demo 中,上面是原视频,仅需一句话把意大利面换成「奶油浓汤」,瞬间完成。

  再比如,上传一个 Sora 之前生成的视频,Gemini Omni 可以直接去除水印。

  有人对此表示,仅是去水印这一点,足以让这一工具成为创作者的游戏规则改变者。

  不仅如此,Gemini Omni 还可以支持风格化输出。

  下面这个动漫风格的视频,蓝色火焰特效、打斗动作线条,每一帧都像是专业动画师手绘的。

  不过早期测试显示,Gemini Omni 额度消耗非常快。

  谷歌杀回,Sora 2 却关停了

  Gemini Omni 泄露的时间点,堪称「精准卡位」。

  就在两周前——4 月 26 日,OpenAI 的 Sora App 正式停服。

  这个曾经让全世界为之疯狂的 AI 视频生成器,走完了它短暂而戏剧化的一生。

  回顾一下 Sora 的死因,简直是一部商业悲剧:

  烧钱速度惊人,据称,Sora 的推理成本高达每天 100 万到 1500 万美元。视频生成比文本和图像生成贵了不止一个量级,而这个成本始终没降下来。

  最关键的是,OpenAI 留不住用户。峰值约 100 万活跃用户,到停服前已跌破 50 万,30 天留存率不到8%。

  整个生命周期的应用内收入仅约210 万美元,连一天的算力费都覆盖不了。

  3 月 24 日,Sora 官方账号在X上发出那句著名的告别,「We're saying goodbye to the Sora app」。

  API 将在 9 月 24 日彻底关闭,一个时代结束了。

  谷歌I/O 2026 将在 5 月 19 日开幕,Gemini Omni 极有可能在主舞台上正式亮相。

  AI 视频赛道,又要变天了。

  有网友将 Omni 生成的视频,和 Sora 2 做了一个直观对比,效果简直差出好几个量级。

  动漫打斗场景中,Gemini Omini 丝滑到炸裂,Sora 特效却一团乱麻。

  I/O倒计时,谷歌摊牌

  除了 Omni,谷歌多款尚未正式发布的 Gemini「全线模型」被意外推送到生产环境 API 中。

  此次泄露的模型阵容极其豪华,包括 Gemini 3 Flash、3.1 全系列(Pro、Flash Image、Lite、TTS),以及专注于高保真音频生成的 Lyria 3 Pro。

  最重磅的是,谷歌即将推出的「Omni」原生多模态视频模型,将针对所有的核心模型推出专门的 Agent 版本。

  I/O主舞台,谷歌要摊牌了!

  参考资料:

https://x.com/chetaslua/status/2053824398503678108?s=20

https://x.com/testingcatalog/status/2053857806374064496?s=20

https://x.com/Waguri_Kaoruko8/status/2053818116237353039?s=20

https://www.reddit.com/r/singularity/comments/1ta99ss/upcoming_leaked_gemini_omni_vs_nearly_shutting/