5分钟直出46页论文!谷歌Deep Research完爆OpenAI,最强Gemini 2.5加持

  新智元报道

  编辑:桃子犀牛

  谷歌 Deep Research 重大升级,搭载全球顶尖 Gemini 2.5 Pro 模型。5 分钟生成 46 页学术论文、复杂报告转为 10 分钟播客。性能超 OpenAI DR 40%,价格仅为其1/10。

  今早,谷歌 Deep Research 迎来史上最强升级,正式搭载了 Gemini 2.5 Pro 全球顶尖模型。

  这一次,新版本在以下方面得到显著的提升:

  • 分析推理:逻辑更清晰,结论更有深度

  • 信息整合:从海量数据中快速提炼要点,化繁为简

  • 报告洞察力:生成的报告不仅详尽,还能提供独到的见解。

  谷歌 CEO 劈柴哥转发力挺。首席科学家、Gemini 负责人 Jeff Dean 也出来为 Deep Research 站台。

  可见谷歌内部对这款产品的重视程度。

  相较于 OpenAI DR,谷歌在整体性能上飙升超 40%。此外,在指令遵循、全面性、完整性、写作质量方面,谷歌 Deep Research 性能跃升很大。

  在内部测试中,谷歌 DR 生成的报告深受评估者青睐,程度远超其他领先 DR 工具 2 倍多。

  这意味着,不论你需要分析复杂问题,还是撰写高质量报告,DR 都能得心应手,节省数小时的时间。

  不过,这次的升级将率先为 Gemini Advanced 订阅用户开放,仅需 19.99 美元,要比 OpenAI DR(200 美元/月)整整便宜 10 倍。

  只需登录网页版、安卓版、或是 iOS 版 GeminiApp,均可第一时间体验新功能。

  而现在,已经有一大批网友开启测试,效果足够惊艳。

  5 分钟搞定 46 页论文+播客

  量子物理学家、AI 研究科学家 ChrisUniverse 第一时间对 Gemini 2.5 Pro 驱动的 Deep Research 做了测试。

  体验之后他被深深震撼到了,「我们正处于技术和信息爆炸的奇点,速度前所未有。」他写道。

  作为一名物理学家,ChrisUniverse 让谷歌 DR 研究了过去五年纳米技术的突破。

  仅仅这一个提示,谷歌 DR 就自己找到并研究了 339 个网站,生成了一篇长达 46 页的完整学术论文。

  论文列举了 5 个全球知名的纳米技术实验室,详细总结了他们过去五年的重要技术突破以及未来的计划。

  论文地址:

https://docs.google.com/document/d/1uxexZharvJJ8ScVFmhrDrFfiYtiSmQ9oeYkZBBxwDZ8/edit?tab=t.0

  除此之外,论文中还通过表格对这五家研究机构做了详细的横向对比。

  如果担心 AI 的幻觉问题,那也没关系,谷歌 DR 在结尾列出了十几页的数据来源链接。

  这还不算完,如果你看到这份 46 页的论文比较头疼,那么再加一句提示词,谷歌 DR 立马帮你把论文转成一个 10 分钟的播客!

  这样你就可以把一篇枯燥的学术论文变成一个类似真人的对话访谈,听着理解其中内容。

  更厉害的是,所有这些过程一共还不到 5 分钟!

  ChrisUniverse 表示,现在自己了解了全球顶尖的 5 家纳米科技公司,包括它们的核心实验室、突破性成果,以及未来 5 年的重点方向。

  「这些信息要是放在 2 年前,可能得花我几天甚至几周时间去研究,说不定还更久。」他说。

  ChrisUniverse 自己也没想到谷歌 DR 如此好用,已经好到让他无话可说了。

  另一位 AI 大佬 Kol Tregaskes 提供一个话题——如何让 AGI 与人类价值观对齐,谷歌 DR 在极短时间内,直出 46 页报告。

  他表示,这次改进比 Gemini 2.0 版本加持 DR 报告长度更多,而且与 OpenAI DR 相当。这从侧面印证了,谷歌基准测试中,DR 的完整性是最强的。

  而且,在报告文末,一共引用了 138 参考链接,在生成过程中查阅了足足 179 个参考网站,对于人类来说,一个时间根本看不完。

  报告地址:https://docs.google.com/document/d/1e4qMho_5p-yfCx6Dqx8BhjW79qEg4C30uj1f1SKCA8k/edit?tab=t.0

  沃顿商学院教授 Ethan Mollick 将课堂一项作业扔给谷歌 DR——为一种采用新型光谱技术、成本 75 美元的食物热量检测设备进行定价及总体可获取市场(TAM)分析。

  他惊喜地发现,Gemini 2.5 加持的 DR 不仅完美完成分析,还提供更多深度洞察。

  要知道,这类分析通常消耗数小时。

  虽然一片叫好之声,网友 Giulio Leone 也指出了谷歌 DR 的一点问题。

  他表示,虽然 Gemini 2.5 Pro 加持的 DR 非常强大,但一旦达到 token 数量限制,报告就会中断。

  Giulio 认为,谷歌应该让报告的生成可以无缝衔接,否则会在严肃的研究中受限。

  胜券在握,DeepMind 注定会赢?

  不难看出,在 AI 激烈角逐中,谷歌 DeepMind 正以无可匹敌的优势崭露头角。

  从数据到硬件,从模型到人才战略,他们似乎已经掌握了通往 AGI 的所有关键要素。

  几天前,Artificial Analysis 一份报告中,展示了谷歌在应用、基础模型、云服务、加速器硬件四大关键领域全面开花。

  网友@ai_for_success 分析称,谷歌 DeepMind 具备了海量的数据优势,依托谷歌生态系统的庞大资源,为训练更强大、更智能 AI 提供坚实基础。

  而目前,DeepMind 拥有业界公认的最优模型阵容,涵盖了多个领域。

  比如,综合性能最强的旗舰模型 Gemini 2.5 Pro;推理模型 Gemini 2.0 Flash 兼具速度与实用性;Veo 2 成为视频生成领域的翘楚。

  不仅如此,他们还手握 TPU 这张王牌,专为深度学习任务优化,性能和效率远超传统 GPU。

  再加上谷歌自身庞大的分发渠道,能够让 DeepMind 的成果无缝集成,迅速抵达全球用户。Google Cloud 更是为 AI 提供高效部署平台。

  这不,一年一度 Google Cloud Next 今晚将在拉斯维加斯召开,届时还会带来更多新品。

  与此同时,谷歌开发者关系负责人 Logan Kilpatrick 也在频频暗示这周的重大发布。

  在人才方面,谷歌 DeepMind 更是通过激进的「竞业禁止协议」,牢牢地锁住了 AI 顶尖人才。

  据 BI 爆料,DeepMind 部分英国员工在离职后,需遵守长达6-12 个月的竞业协议,在此期间不得为竞争对手工作。

  为了确保这些人才不流向对手,他们甚至还会为部分员工提供「花园休假」(garden leave),即在竞业期继续支付薪水,但员工务虚工作。

  与其让人才立即跳槽至对手公司,谷歌宁愿花钱让他们休假一年。

  一位前 DeepMind 员工无奈地表示,「在 AI 这个圈子,一年后再入职,谁会签你」?

  的确,在 AI 日新月异的当下,6 个月空窗期就可能让人错误无数机会,更不用说整整一年。

  就连微软 AI 副总 Nando de Freitas 曾公开抨击了这种做法,称其为「滥用权力」。

  谷歌这种做法,无非只有一个目的,在 AGI 竞赛中拔得头筹。

  前谷歌员工甚至表示,「当前 AI 热潮如同『太空竞赛』,这是我职业生涯中看到如此疯狂的战争。领先 6 个月或是 1 年,可能就意味着一切」。

  大模型、人才、数据、硬件,谷歌 DeepMind 几乎在这场终极赛的每个环节,都占据了制高点。

  AGI 终点尚不明朗,但至少现在,他们已经手握胜券的所有筹码。

  参考资料:

  https://x.com/GeminiApp/status/1909721519724339226

  https://x.com/testingcatalog/status/1909725934846116209

  https://x.com/ChrisUniverseB/status/1909744703504793952

  https://blog.google/products/gemini/deep-research-gemini-2-5-pro-experimental/?utm_source=tw&utm_medium=social&utm_campaign=og&utm_content=&utm_term=