谷歌全新Gemini Omni首曝，视频版「香蕉」来了！教授黑板推公式全对

　　新智元报道

　　编辑：桃子好困

　　今天，谷歌原生视频模型 Gemini Omni 意外曝光！各种惊艳 demo 刷爆，教授黑板推导数学公式、一句话编辑视频，丝滑程度让全网破防。

　　谷歌I/O大会开幕在即，原生 Gemini 提前曝光！

　　如今，全网都被这个视频刷爆了——一位教授在台上一边讲课，一边在黑板上随手推导公式，这质感、丝滑度，堪称惊艳。

　　实际上，这是由「全新视频模型」Gemini Omni 生成，连贯性、一致性直接拉满。

　　有网友惊叹道，视频版 Nano Banana 来了！

　　还有人表示，眼见为实已经不存在了。

　　原生 Gemini Omni，首次曝光了

　　就在昨天，Gemini 移动端 App 主页截图流出，一个全新视频模型 Gemini Omni 入口上线。

　　界面中，赫然写着——快来认识一下我们全新的视频生成模型。重新混剪你的视频，直接在对话中编辑，尝试模板。

　　显然，谷歌以全新形式带来了 Gemini Omni！

　　这可能是一个全模态的 Gemini，同时支持文本、图像、音频、视频输入和输出。

　　与 Veo 不同的是，Omni 将像 Nano Banana 一样深度集成到 Gemini 中，具备更出色的提示理解与推理能力。

　　尤其是，在实时视频编辑上，可以一键物体替换，去除水印。

　　与此同时，Omni 模型的 ID 也被同时爆出——

　　fbard_eac_video_generation_omni /bard/v3smm-lora-prod.goat-cr-rev6-xm171555416-at-1200

　　可见，Omni 生成的视频支持 10s 时长，分辨率 1280x720。

　　真正让全网陷入疯狂的是，几个提前测试放出的 demo。

　　教授黑板推公式，全网震惊

　　最炸裂的那个一，便是开篇「教授在黑板上推导三角恒等式」的视频。

　　画面中，教授手持粉笔在黑板上一步一步写下数学证明，同时用口语同步讲解当前推导步骤。

　　懂行的人看到这会直接跳起来。在 AI 生成视频里把数学公式写对，这件事有多难？

　　文本一致性一直是视频生成模型的「阿喀琉斯之踵」。

　　此前，Sora 生成的文字经常是看着像字，但仔细一看全是「鬼画符」的状态，更别提完整的数学推导了。

　　而 Omni 的这段 demo，公式是对的，推导是连贯的，笔迹是自然的。

　　更难以想象的是，这个惊艳的 demo，仅用了一句提示词——

　　A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.

　　许多人看完，直接破防！

　　不得不说，AI 视频生成已跨越「恐怖谷」，正式进入超写实时代。

　　还有灰度到的网友，也做了一批类似的视频，个个都好到爆。

　　真正的杀手锏：实时编辑

　　Gemini Omni 强大之处不止于生成，这一次，「实时编辑」也实现了大幅跨越。

　　泄露的演示中，Omni 展现了令人瞠目的编辑能力——

一键去水印：Omni 可以直接对话去水印，且画面毫无破绽；
物体替换：动动嘴，视频中的物体就被精准替换，光影、遮挡关系全部自动适配；

　　如下 demo 中，上面是原视频，仅需一句话把意大利面换成「奶油浓汤」，瞬间完成。

　　再比如，上传一个 Sora 之前生成的视频，Gemini Omni 可以直接去除水印。

　　有人对此表示，仅是去水印这一点，足以让这一工具成为创作者的游戏规则改变者。

　　不仅如此，Gemini Omni 还可以支持风格化输出。

　　下面这个动漫风格的视频，蓝色火焰特效、打斗动作线条，每一帧都像是专业动画师手绘的。

　　不过早期测试显示，Gemini Omni 额度消耗非常快。

　　谷歌杀回，Sora 2 却关停了

　　Gemini Omni 泄露的时间点，堪称「精准卡位」。

　　就在两周前——4 月 26 日，OpenAI 的 Sora App 正式停服。

　　这个曾经让全世界为之疯狂的 AI 视频生成器，走完了它短暂而戏剧化的一生。

　　回顾一下 Sora 的死因，简直是一部商业悲剧：

　　烧钱速度惊人，据称，Sora 的推理成本高达每天 100 万到 1500 万美元。视频生成比文本和图像生成贵了不止一个量级，而这个成本始终没降下来。

　　最关键的是，OpenAI 留不住用户。峰值约 100 万活跃用户，到停服前已跌破 50 万，30 天留存率不到8%。

　　整个生命周期的应用内收入仅约210 万美元，连一天的算力费都覆盖不了。

　　3 月 24 日，Sora 官方账号在X上发出那句著名的告别，「We're saying goodbye to the Sora app」。

　　API 将在 9 月 24 日彻底关闭，一个时代结束了。

　　谷歌I/O 2026 将在 5 月 19 日开幕，Gemini Omni 极有可能在主舞台上正式亮相。

　　AI 视频赛道，又要变天了。

　　有网友将 Omni 生成的视频，和 Sora 2 做了一个直观对比，效果简直差出好几个量级。

　　动漫打斗场景中，Gemini Omini 丝滑到炸裂，Sora 特效却一团乱麻。

　　I/O倒计时，谷歌摊牌

　　除了 Omni，谷歌多款尚未正式发布的 Gemini「全线模型」被意外推送到生产环境 API 中。

　　此次泄露的模型阵容极其豪华，包括 Gemini 3 Flash、3.1 全系列（Pro、Flash Image、Lite、TTS），以及专注于高保真音频生成的 Lyria 3 Pro。

　　最重磅的是，谷歌即将推出的「Omni」原生多模态视频模型，将针对所有的核心模型推出专门的 Agent 版本。

　　I/O主舞台，谷歌要摊牌了！

　　参考资料：

https://x.com/chetaslua/status/2053824398503678108?s=20

https://x.com/testingcatalog/status/2053857806374064496?s=20

https://x.com/Waguri_Kaoruko8/status/2053818116237353039?s=20

https://www.reddit.com/r/singularity/comments/1ta99ss/upcoming_leaked_gemini_omni_vs_nearly_shutting/

作者：itwriter
来源：互联网
日期：2026-05-12
浏览 (1035)