作者邓咏仪周鑫雨
编辑苏建勋杨轩
36 氪独家获悉,阿里通义千问大模型技术负责人周畅(花名:钟煌)将从阿里云离职,下场创业。
36 氪了解到,周畅目前还在阿里云系统中,尚未正式离职。但 36 氪从多方独立信源处得知,周畅已确定要创业。一位消息人士对 36 氪表示,周畅或将投身于 AI 应用领域。
而另一位知情人士表示,周畅是通义实验室算法团队的核心技术骨干之一,属于正常离职。通义大模型的研发和开源工作还在进行中,目前通义实验室负责人为阿里云 CTO 周靖人。
对于上述信息,36 氪向阿里云求证,截至发稿,暂无回复。
周畅为“通义千问”的大模型负责人,他于 2012 年本科毕业于复旦计算机科学与技术专业,2017 年博士毕业于北京大学计算机软件与理论专业,而后加入阿里巴巴。他先后在达摩院任职算法专家,再到通义千问的大模型负责人。其专攻领域为深度学习、图挖掘和分布式计算,他在机器学习、数据挖掘、数据库领域国际顶级会议上发表 30 余篇文章,并担任 NeurIPS/ICML/KDD/WWW 等学术会议的审稿人。
阿里是国内最早成体系地投入在大模型领域里投入研发的大公司。2019 年,阿里就在 BERT 路线的基础上推出了预训练大语言模型 structBERT,而后在 2021 年推出了多模态大模型 M6,再到如今的通义大模型家族。
达摩院下属的通义实验室,也是如今大模型圈内的“人才高地”。如前不久官宣创业的前字节模型技术研发负责人杨红霞,已加入 Salesforce 的前任实验室负责人司罗、通义视觉实验室负责人徐盈辉等等,都出自达摩院体系,这都是培养起阿里大模型团队的第一批顶尖 AI 人才。
周畅则是完整经历过阿里大模型演变历程的核心技术骨干。在 2020-2021 年间,他带领团队设计并实现了超大规模的多模态预训练模型 M6,在参数数量和低碳训练模式上曾取得突破。
而更早之前,他曾研发超大规模商品图表征算法 APP、用户表征框架 ATRank、基于自监督对比学习的向量召回算法 CLRec 系列,这些技术都有落地到实际应用场景中——比如在手淘多个个性化推荐场景下,让效果获得大幅提升。
进入 2024 年,国内大模型行业已经进入走过萌芽期,基础大模型层已经格局出现——玩家包括大厂如阿里、字节、腾讯,创业公司如智谱 AI、Minimax、月之暗面、百川智能等。市场普遍将关注度放在了 AI 应用一侧,关注大模型如何落地到千行百业中,这也会带动新一波 AI 人才的创业热潮。