
5 月 21 日消息,周二,谷歌在位于加州山景城的海岸线圆形剧场举办一年一度的 Google I/O开发者大会。会上谷歌宣布了涉及智能搜索、智能邮件回复、智能眼镜、音视频工具等一系列新功能,还发布了新的音视频人工智能工具。以下为本届 Google I/O开发者大会上的主要亮点
向全美搜索用户推送 AI 模式
谷歌宣布,开始向美国所有搜索用户全面推广人工智能模式。早在今年 3 月初,谷歌便在旗下实验室 Labs 的测试项目中首次向部分用户开放预览版人工智能模式,随后几个月逐步扩大开放范围,最近甚至已经开始覆盖普通搜索用户。谷歌在 Google I/O开发者大会上公布了多项即将上线的人工智能模式新功能,包括购物助手、自动比价工具,以及可用于查询金融和体育类信息的自定义图表生成器。
简而言之,人工智能模式是嵌入谷歌搜索的聊天机器人,独立于传统搜索标签页,能处理更复杂的查询任务,比如用户可以通过人工智能模式对多款健身追踪器进行横向比较。此前聊天机器人运行的是 Gemini 2.0 模型,如今则已升级为定制版 Gemini 2.5。谷歌还表示,未来将把人工智能模式中的诸多功能逐步整合进主搜索体验中的人工智能摘要中。
“人工智能模式将率先引入 Gemini 的前沿功能,同时也展示出未来谷歌搜索的发展方向,”谷歌在大会期间发布的博客文章中写道,“我们将基于用户反馈不断优化,将人工智能模式中的很多功能和体验直接融入核心搜索流程。”
谷歌还计划将“深度搜索”(Deep Search)功能引入人工智能模式。这一功能源自谷歌去年 12 月首次亮相的“深度研究”(Deep Research)模式,用户可以要求 Gemini 等聊天机器人花更多时间对主题进行深入调研、生成详尽的分析报告。如今,谷歌将在人工智能模式中开放这一工具,让更多普通用户也能体验到类似服务。
人工智能模式即将上线的另一项新功能基于谷歌早前开发的 Project Mariner。这一功能将使人工智能模式能够主动为用户完成上网任务。例如,用户可以让它帮忙查找所在城市一场体育比赛的两张平价门票,新功能将自动比对数百种选项,筛选出最优推荐,用户无需亲自逐一浏览比价,便可直接完成购买。
谷歌表示:“我们将在活动门票、餐厅预订和本地服务预约等场景率先启动,并与 Ticketmaster、StubHub、Resy 和 Vagaro 等合作打造流畅且实用的服务体验。”
此外,人工智能模式很快还将能根据用户具体问题生成定制图表和可视化图形。谷歌还计划推出一项可选功能,参考用户过往搜索记录实现个性化推荐。用户可以选择将 Gmail 等其他谷歌服务与人工智能模式关联,进一步提升个性化推荐的深度和精确度。
谷歌还为人工智能模式新增了一整套购物功能,帮助用户筛选产品,并在获得授权的前提下代为完成下单流程。
目前,谷歌预告的一系列人工智能模式新功能将优先向测试用户发布,随后再逐步开放给普通用户。
Gemini 登陆 Chrome 浏览器
谷歌还宣布,人工智能助手 Gemini 即将登陆 Chrome 浏览器。
谷歌实验室和 Gemini 副总裁乔希·伍德沃德(Josh Woodwar)透露,初期 Gemini 将能“帮用户厘清或总结网页上的复杂信息”。谷歌愿景是未来 Chrome 浏览器中的 Gemini 能“跨多个标签页工作,代用户浏览网站”。
演示中 Chrome 浏览器右上角多了一个小的闪光图标。用户点击会弹出 Gemini 聊天窗口,这个悬窗可以随意移动和调整大小。用户可以直接在里面提问,询问当前网页上的内容。
Chrome 团队产品管理总监沙曼·迪席尔瓦(Charmaine D’Silva)打开购物网站上一个睡袋的页面,然后让 Gemini 列出睡袋的主要特点。Gemini 迅速浏览了整个页面,并给出这款睡袋的简洁摘要。迪席尔瓦又问这个睡袋是否适合在缅因州露营,Gemini 结合页面和网络信息给出答案。
迪席尔瓦又切换到另一个购物网站上的另一款睡袋页面,并让 Gemini 对比两款睡袋。Gemini 不仅完成了对比,还生成了一张对比表格。
最初用户可以在不同标签页之间切换时保持与 Gemini 的对话。但“今年晚些时候”,Gemini 将允许用户一次选择多个标签页并提问。
迪席尔瓦还展示了利用 Gemini 来浏览食谱网站。他要求 Gemini 切到页面的配料部分,并将所需的糖量从杯换算成克,Gemini 都迅速给出了响应。从演示来看,Chrome 浏览器中的 Gemini 擅长进行产品对比或换算不同单位。
Chrome 中的 Gemini 将于本周三正式上线。初期将先面向 18 岁及以上、使用 Windows 和 macOS 的英语用户开放体验。谷歌副总裁兼 Chrome 总经理帕里莎·塔布里兹(Parisa Tabriz)表示,主要面向 Google AI Pro 和 Ultra 订阅用户,以及 Chrome 的 beta、canary 和 dev 渠道用户。
至于 Gemini 何时能登陆移动版 Chrome,塔布里兹表示“这是一个我们会考虑的领域”,但目前公司“非常专注于桌面端”。
一系列音视频 AI 工具
谷歌周二正式发布了能够生成视频并同步嵌入音频的人工智能工具 Veo 3。
这款工具对标 OpenAI 的 Sora 视频生成器,但与后者最大的区别在于 Veo 3 能够将音频一并融入生成视频中。谷歌表示,Veo 3 不仅可以生成角色对话,还能合成动物叫声等环境音效。
“Veo 3 在生成文本和图像提示、模拟真实物理效果以及精准同步唇形同步方面表现出色,”谷歌 DeepMind 产品副总裁埃力·柯林斯(Eli Collins) 在周二发布的博客中写道。
这款人工智能音视频工具已于周二向订阅 Ultra 计划的美国用户开放。Veo 3 也将面向 Google Vertex AI 企业平台用户提供服务。
谷歌还同步发布了新一代图像生成工具 Imagen 4,称其可通过用户提示生成质量更高的图像。此外,谷歌还推出了一款名为 Flow 的全新电影制作工具,用户只需描述场景、镜头和风格偏好,即可生成具有电影质感的视频。Flow 可通过 Gemini、Whisk、Vertex AI 和 Workspace 访问使用。
这些新产品的推出,正值图像与视频内容逐步成为生成式人工智能应用的热门场景。今年 3 月份 OpenAI 首席执行官萨姆·奥特曼(Sam Altman )曾表示,ChatGPT 4o 的图像生成功能一度太过火爆,“几乎要烧坏”公司的服务器芯片,他们不得不临时限制该功能的使用频率。
去年,谷歌曾因 Imagen 3 模型生成的历史不实图像受到大量批评,最终被迫下线并重新发布。公司联合创始人谢尔盖·布林(Sergey Brin)事后表示,主要原因是“缺乏充分测试”。
此外,谷歌还升级了 Veo 2 视频生成器,增加用户通过文本指令添加或移除视频中物体的功能。同时,谷歌还开放了 Lyria 2 音乐生成模型。
升级 Gmail 智能回复
谷歌还宣布,Gmail 的智能回复功能将迎来重大升级:不仅能从用户正在阅读的一系列邮件中获取信息,还能深入挖掘 Gmail 收件箱和 Google Drive 文件,生成更贴近用户语气、内容更精准的回复建议。
这项改进是去年智能回复功能加入“上下文理解能力”后进一步提升功能。当时升级让智能回复不再局限于“好的”或“没问题”等简短内容,而是可以生成更长更完整的回应。不过,那时智能回复只能参考往来邮件中的内容。而现在人工智能能够调用邮件之外的信息,关联更多上下文。
Google Workspace 产品副总裁布莱克·巴纳斯(Blake Barnes )表示:“Gemini 能够理解用户当前需要应对的情境,并主动承担‘翻资料’和‘重读长邮件’这类耗时工作,确保回复信息准确、内容全面。”
此外,新的智能回复还会根据用户与收件人的关系来调整语气和风格。比如在给上司写邮件时,可能会建议使用更正式的措辞;而如果是和朋友互动,预期则会更轻松随意。
巴纳斯表示:“我们正从‘人工智能对所有人都大致有帮助’,进步到‘人工智能对你个人真正有帮助’的阶段。”
巴纳斯说“使用这项功能的人已经不少”。他还提醒,用户发送前最好检查一遍内容,以防生成的回复出现“幻觉”。
升级后的智能回复将首先上线英文版,适用于网页版、iOS 和 Android 客户端,并将于今年 7 月份在 Google Labs 推出 Alpha 测试版。正式版预计会在今年第三季度开放。
需要注意的是, 升级后的智能回复属于付费服务,面向 Google Workspace 付费用户以及 Google One AI Premium 订阅用户开放。
合作打造潮流智能眼镜
谷歌还宣布将与三星、Gentle Monster 以及 Warby Parker 合作,共同打造人们“愿意佩戴”的智能眼镜。
此次合作表明谷歌这次在“外观设计”上的确动了真格,因为 Warby Parker、Gentle Monster 都是当下炙手可热的潮牌眼镜。这一波合作明显表明谷歌开发的 Android XR 不仅想做人人可戴的“日常眼镜”,还想吸引那些追逐潮流的时尚先锋。
谷歌似乎还将 XR 智能眼镜的硬件部分交给三星负责。谷歌 XR 部门副总裁沙赫拉姆·伊扎迪(Shahram Izadi)表示,公司正在“深化与三星的合作,从头戴设备拓展至眼镜产品”。此外,谷歌还宣布,首款搭载 Android XR 的智能眼镜将由 Xreal 打造,项目代号为 Project Aura。
谷歌特别强调,这款 XR 智能眼镜将是 Gemini AI 的理想载体。原型眼镜配备摄像头、麦克风和扬声器,通过人工智能助理实时感知并解读用户周围环境。演示功能包括拍照、导航以及实时语言翻译。近几个月来,谷歌陆续公开了相关功能。
综合来看,谷歌显然是在参考 Meta 智能眼镜的成功经验,相当于正面承认 Meta 与雷朋合作的成绩斐然。今年 2 月,Meta 公布旗下雷朋智能眼镜销量已达 200 万副,成其是人工智能助理的理想硬件。
简而言之,谷歌这次不仅是要做功能更强大的眼镜,更是要做得够潮够范儿。(辰辰)