近日,Google Cloud 大会上,Google 第七代 TPU「Ironwood」正式亮相,其为 Google 迄今为止性能最强、可扩展性最高的定制 AI 加速器,也是首款专为推理设计的加速器。
相较于 Google 第一代 TPU,Ironwood 推理性能猛涨 3600 倍,能耗效率提升 29 倍;而与上一代 Trillium 相比,Ironwood 在能耗效率上也实现了 2 倍的提升。硬件方面:
- Ironwood 搭载了高达 192GB 的显存,在带宽方面提升到至 7.2 Tbps,双向带宽也增加到 1.2 Tbps,让数据、芯片之间的传输速度更快,提升大规模分布式训练和推理的效率。
- Ironwood 最高规格「9216 版本」算力总计可达到 42.5 Exaflop(每个独立芯片峰值算力为 4614 TFLOPs),届时 Ironwood 的算力是世界上最大的超级计算机 El Capitan 的 24 倍以上。
同日,Google 还公布了多个项目、技术更新:
- Vertex AI 加入「文字转音乐模型」Lyria,成为唯一一个涵盖所有模态(视频、图像、语音和音乐)的生成式媒体模型的平台;
- Google AI 视频生成模型 Veo 2 新增视频修复、画面拓展、镜头构图指导等功能;
- 文字转图像模型 Imagen 3 提升画面细节表现,拥有更丰富的光照以及减少干扰性伪影,同时还改善了图像修复(擦除)能力。
Google 还推出了 Agent(智能体)的全新开放协议「Agent2Agent(A2A)」,其旨在帮助多个智能体之间能够相互协作,并通过开放协议相互通信,从而提升智能体的实用性。值得一提的是,A2A 协议是对 Anthropic 提出的 MCP 模型上下文协议的补充,Google 还在昨日宣布,旗下 Gemini 模型也将支持 MCP 协议。
据悉,模型上下文协议(Model Context Protocol,MCP)是由 Anthropic 推出的开源协议,旨在实现大语言模型与外部数据源和工具的集成,用来在大模型和数据源之间建立安全双向的连接。
另外,Google 的 AI 编码助手「Gemini Code Assist」已经在预览版中提供了 Agent(智能体)能力。Google 在大会上宣布,Code Assist 中的智能体可以执行多个步骤并完成复杂的编程任务。