
新智元报道
编辑:元宇
谷歌世界模型大牛 Danijar Hafner 宣布离任!他自 2016 年起开始在 Google Brain 实习,后又在 DeepMind、Brain Team 工作。他的经历颇具传奇色彩,曾获辛顿指导,还与Łukasz Kaiser、Ashish Vaswani 等 Transformer 大佬有过交集。
刚刚,「Dreamer」大神 Danijar Hafner,宣布离开他曾工作近十年的谷歌。
离职前 Danijar 担任 Google DeepMind 旧金山分部的资深研究科学家(Staff Research Scientist)。
他的研究目标是「构建能够理解世界并与世界互动的通用智能体」。
作为谷歌世界模型大牛,Danijar 曾主导/联合主导了 Dreamer 系列(Dreamer、DreamerV3、Dreamer4 等)的开发。

Danijar Hafner
他在推文中写道:「今天是我在 DeepMind 的最后一天」。

回顾了在 Google 和 DeepMind 将近 10 年的工作经历,Danijar 认为「一个重要的篇章走到了终点」。
Danijar 在谷歌的早期经历,多是以研究员的身份参与谷歌研究院、DeepMind、Brain Team 等团队的工作。
从他的教育经历中,也能清晰看出他的职业发展轨迹。

从 2016 年起,他就开始参与 Brain 团队的实习。
据 Danijar 回忆,2016 年他第一次在山景城参与谷歌 Brain 团队的实习,与 James Davidson 以及 Vincent Vanhoucke 一起共事。
因为当时尚无可运行的 PPO 实现,团队就在 TensorFlow 的静态图框架下进行调试和实验。
2017-2018 年,Danijar 在伦敦大学读硕士,期间他就在伦敦的 DeepMind 工作;
2018-2023 年,Danijar 在多伦多大学读博士,因此他就在多伦多的 Brain Team 工作了相当长一段时间。
他与该团队另一位资深研究科学家 Mohammad Norouzi 共同开发了多个版本的 Dreamer。
初识 Transformer
但「并未在意」
Danijar 还记得Łukasz Kaiser 第一次向他们展示一个由「大型」LSTM 生成的维基百科页面时的情形。

Łukasz Kaiser
Łukasz 是一位机器学习研究员,他最初在 Google Brain 团队工作,后来加入 OpenAI。
Google Brain 团队曾于 2018 年发表《Generating Wikipedia by Summarizing Long Sequences》,Łukasz Kaiser 是作者之一,主题就是端到端生成维基百科条目。

https://arxiv.org/abs/1801.10198?utm_source=chatgpt.com
Danijar 还提到他「错过」Transformer 的一段插曲。
当时,Ashish Vaswani 曾经兴奋地向他介绍一种新架构在计算效率上的优势,并建议他将其应用在强化学习上,但那时 Danijar 却并未在意(我当时没试)。
后来这种架构被命名为 Transformer。

Ashish Vaswani

https://arxiv.org/abs/1706.03762?utm_source=chatgpt.com
Ashish Vaswani 是一位在 AI 领域颇具影响力的科学家与创业者。
他是 Essential AI 的联合创始人,但更为人熟知的是参与提出了那篇著名的《Attention Is All You Need》的开创性论文。
该论文提出了一种「彻底摒弃循环和卷积结构,仅用注意力机制」的全新简单网络架构 Transformer,可以实现更强的并行性和更快的训练速度。
前面提到的Łukasz Kaiser 也是这篇开创性论文的主要作者之一。
深度学习研究
2017-2018 年,Danijar 在伦敦大学攻读硕士。
这段时间他在伦敦的 DeepMind 工作,有机会参与到深度强化学习和生成式模型的研究,并与 Timothy Lillicrap(DeepMind)以及 Ian Fischer(Google Research)合作。
这段经历促成了他们共同完成了 PlaNet(一种基于模型的强化学习算法,能从像素观测学习潜在世界模型,并在潜空间中进行规划与动作选择)。

Timothy Lillicrap
随后,Danijar 与 Nicolas Heess、DeepMind 的 Adaptive Agents 团队长期交流,系统梳理并实践 Karl Friston 的自由能原理(Free Energy Principle, FEP)。
开发 Dreamer
曾获辛顿指导
2018-2023 年,Danijar 在多伦多大学读博士,这段时期他还在加州大学伯克利分校以联合培养博士生的身份开展研究。
在多伦多大学读博期间,Danijar 的主要导师是 Jimmy Ba,同时还获得了辛顿(Jeffrey Hinton)的指导。
在此期间,Danijar 还在多伦多的 Brain Team 工作了相当长一段时间。

Mohammad Norouzi
他与 Google Brain 多伦多分部的资深研究科学家 Mohammad Norouzi 共同开发了多个版本的 Dreamer。
他们参与各种合作项目,还一起庆祝了辛顿获得获得图灵奖的时刻。


2018 年的图灵奖授予 Yoshua Bengio、Geoffrey Hinton 和 Yann LeCun
过去几年,Danijar 一直在伯克利和旧金山之间,与 Wilson Yan 合作深入研究世界模型。
在 Count Zero 和 Koray Kavukcuoglu 的大力支持下,他得以充分利用顶级的算力与资源,推动了一系列前沿探索。
从 Dreamer 到 DreamerV3,再到能够在想象中自主学习、甚至在纯离线环境下完成复杂任务的 Dreamer4,这一系列成果令 Danijar 激动。
在 Danijar 的个人官网主页上,他的个人愿景十分醒目:「构建能够自主理解世界并与世界互动的智能机器。」

对他而言,世界模型不仅是技术突破,更是理解智能本质的一扇窗口。
如今,Danijar 即将结束他在 Google/DeepMind 的十年旅程,带着复杂的心情和满怀期待,迎接新的篇章。
参考资料:
