帮Gemini拿下IMO金牌的关键先生,差点成了职业钢琴家

  听雨发自凹非寺

  量子位 | 公众号 QbitAI

  原来大模型圈里,还有这么会弹钢琴的人!

  视频地址:https://mp.weixin.qq.com/s/BNWO1nDe3DFZqLOVlSIYLw

  一首肖邦的《幻想即兴曲》,弹的是行云流水、如痴如醉。

  高难度琶音,双手交错,情绪张力直接拉满了。

  并且他,正是帮谷歌 Gemini 拿下 IMO 金牌的关键人物。

  他叫 Yi Tay,是 Google DeepMind 的研究科学家。

  去年带着 Gemini Deep Think,拿下了 IMO 国际数学奥林匹克金牌,今年 2 月 Gemini 3 Deep Think 的发布,他也是核心贡献者。

  这支视频发布在他的 Instagram 上,是他偶然发现的一条 14 年前的旧视频。

  那时的他,只是一个普通的 NTU(南洋理工大学)本科生,努力应付考试,抽空去琴房练琴。

  他说,在另一个平行宇宙中,如果没有走上 AI 研究这条路,自己会去当一位职业音乐家。

  看主页这一头飘逸的秀发,确实很有艺术家气质啊~

  Yi Tay 的大模型之路

  关于 Yi Tay,最为人所知的履历应该是他带队训练出的 Gemini Deep Think,拿下了 IMO 金牌

  去年 7 月,Gemini Deep Think 在 IMO 上达到了金牌水准,Yi Tay 正是这个模型的建模 co-captain 之一。

  这也是他 2025 年工作的一大亮点。

  当然,这还不是全部。

  按照 Yi Tay 自己的年终总结,除了 IMO 金牌,他还通过研究和担任 captain 的方式为 Gemini 2.5 和 Gemini 3 做出了贡献。

  今年 2 月发布的 Gemini 3 Deep Think,在 2025 年国际物理奥林匹克和化学奥林匹克笔试部分同样达到金牌水准,他也是核心贡献者之一。

  2 月发布的 Gemini Deep Think 数学研究论文的工作,Yi Tay 也参与其中。

  从 2025 年底开始,Google DeepMind 正式宣布由 Yi Tay 领导在新加坡组建新研究团队,向 Quoc Le 汇报。

  方向聚焦 reasoning、RL,直接服务 Gemini 核心后训练。

  这个团队也被命名为「推理与 AGI 团队」。名字里带有「AGI」,是为了表明团队的北极星是「将模型带向 AGI」。

  如果再往前看,他的履历更厚。

  在 Google Brain 期间,他做了UL2——一个把编码器-解码器和自回归两种预训练范式统一起来的框架。

  后来 PaLM-2 内部用了「UL2-like」的训练目标,UL2 的影响还扩散到了 PaLI-X、CoLT5 等多个后续模型。

  他也是PaLM-2的建模 co-lead 之一,参与了 Flan-2 的工作。

  还有DSI,一个把搜索重新定义为「让模型直接预测文档标识符」的生成式检索范式。

  现在已经在 YouTube 推荐系统和 Spotify 里部署落地,规模远超最初预期。

  但在 Google Brain 工作了 3 年多之后,他决心出去创业。

  2023 年,他联合创办Reka AI,担任联合创始人兼首席科学家。

  团队最初大约有二十来个人,不到一年,从零训出了 GPT-4 级别的多模态模型,巅峰时期还登上 LMSYS 排行榜前五(由加州大学伯克利分校发起、让真实用户盲测打分的 AI 模型实力榜单)。

  当然,创业是有代价的。

  在创业期间,Yi Tay 每天喝五杯咖啡,吃两次外卖,不仅高强度工作,作息也极其不规律。

  同时,他的妻子也怀孕了。为了同时扛住创业和家庭,他的身心健康付出了代价,体重猛增 30 斤。

  于是,创业 639 天后,他宣布重返谷歌,回归一名研究员的生活。

  他还非常高兴地在博客中写道:回归研究、回到 TPU、回到这套传奇的基础设施,我是真心感到快乐和平静的。

  能和以前最喜欢的合作者、好朋友们重新聚在一起,也让我非常开心。

  而回谷歌之后,生活也是肉眼可见地好起来了。

  Yi Tay 在年终总结里写道:

  • 重返谷歌一年后,自己成功减重约 20 公斤,变得更健康了;
  • 重新开始打羽毛球,还赢得了谷歌新加坡内部的混双比赛;
  • 与家人共度了大量优质时光;
  • 看着女儿从 1 岁长到 2 岁。

  如果仔细阅读 Yi Tay 的博客,会发现在技术和研究之外——他真的是一个非常热爱生活的人。

  「如果不研究 AI,我想去弹钢琴」

  关于 Yi Tay,不太为人所知的履历是,他其实是个钢琴大神。

  有可能是做大模型的研究员里最会弹钢琴的。

  把时间拨回 2011 年前后。

  那时,Yi Tay 还是 NTU(南洋理工大学)的计算机科学本科生,正在应付考试。

  没有 ChatGPT,没有大模型战争,连 Transformer 都还没诞生。

  AI 的故事还很遥远,大部分人根本不知道那会是什么。

  而 Yi Tay 那时的兴趣,就是钢琴。

  2012 年,他在 Trinity College London(英国伦敦圣三一学院)获得了古典钢琴演奏副学士文凭(Associate Diploma)。

  Trinity 钢琴文凭是英国权威考级体系,副学士级别相当于半专业演奏水准。

  视频里弹的那首《幻想即兴曲》,是肖邦技术难度最高的作品之一。

  左手和弦稳定的同时,右手要跑出快速的分解音型,速度、情绪、力度都要控制到位。

  这是他 22 岁时弹出来的作品,但他说,自己现在已经弹不了了。

  Yi Tay 在自己个人网站上写道:如果没有走上研究这条路,他想成为职业音乐家

  他的妻子也是一名音乐家。他还说,「等我退休,想重新捡起古典钢琴」

  对于那个热爱生活的 Yi Tay 来说,这确实像他的风格。

  或许我们应该期待,等他退休之后——

  说不定大模型界少了一个研究员,但钢琴界会多一个迟到了几十年的新星~

  [1]https://x.com/heyrimsha/status/2059232978782609649

  [2]https://www.yitay.net/about

  [3]https://www.instagram.com/reel/DYuVsNYpwZQ/

  [4]https://www.yitay.net/blog/my-year-back-at-google-deepmind