千万年薪!雷军挖来“AI天才少女”

  文|本原财经

  雷布斯发力大模型。

  总裁在线挖人的风还是传到了雷军这里。

  据第一财经报道,雷军开出千万年薪招揽了一位 95 后 AI 天才少女——DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉。

  罗福莉其人,硕士毕业于北京大学计算语言学专业,曾在阿里巴巴达摩院任职,因在国际顶会发表 8 篇论文而走红。加入小米后,罗福莉或将供职于小米 AI 实验室,领导小米大模型团队。

  小米在大模型领域的布局相对较晚,如今总裁雷军亲自出手摇人,AI 领域或许也要掀起一阵"腥风血雨"了。

  01 95 后天才萝莉

  被雷军看中的罗福莉到底何许人也?

  大家给罗福莉起了个"95 后 AI 天才小萝莉"的称呼。

  自称"起点很低"的罗福莉出生在四川小城一个普通家庭,甚至在上大学之前几乎没接触过电脑。

  本科就读于北京师范大学,误打误撞进入计算机专业,起初成绩垫底,经历一段清苦但充实的时光,成绩终于爬到了前几。

  大三被打击"你没有天赋做科研",却凭借天赋和努力保研进入北京大学计算语言学研究所。

  人生转折发生在 2019 年。身为北大硕士的她,在 NLP 国际顶会 ACL 上发表 8 篇论文(其中 2 篇一作),迅速登上知乎热搜而走红。

  ▲图源:罗福莉知乎回应

  人生转折发生在 2019 年。身为北大硕士的她,在 NLP 国际顶会 ACL 上发表 8 篇论文(其中 2 篇一作),迅速登上知乎热搜而走红。

  她提出的词义消歧方法,和文本风格转换框架等成果,推动了 NLP 技术发展,因而成为"天才 AI 少女"。

  研究生时期的罗福莉已经达到了博士生的毕业标准,却选择了直接毕业参加校招进入工业界。

  这对于罗福莉来说,是一步想把路走得更宽的棋——"既然已经具备了博士毕业的学术水平,那在最好的年纪就去做一些不一样的事情。"

  ▲图源:罗福莉参加 ACL2019 顶会

  那一年,她基本上拿下了国内各个大厂的最 Top 的硕士 offer,包括阿里星、腾讯技术大咖、百度 AIDU 计划等等。

  她选择了加入阿里达摩院机器智能实验室,主导开发多语言预训练模型 VECO。此外,她还主导了 AliceMind 的开源工作。

  此后,加入幻方量化(量化对冲基金公司)从事深度学习相关策略建模和算法研究。

  2022 年,她又跳槽 DeepSeek 担任深度学习研究员,参与研发 MoE 大模型 DeepSeek-V2。

  DeepSeek-V2 模型一大亮点是性价比,罗福莉表示 1 元/百万输入 Tokens 的价格,只有 GPT4 的1/100,这或许正是小米看中的点。

  今天的罗福莉,学术成果丰硕、职场履历精彩,但她依旧谦逊低调,经常在自媒体端分享自己的心得,想激励那些和她一样不是一开始就领跑的伙伴们,与网友的互动也十分接地气。

  深耕自然语言处理领域,技术实力深厚,又自带"天才 AI 少女""95 后 AI 萝莉"的标签,符合"营销天团"小米的调性,可以想象小米发布会热搜霸屏的场景了。

  02 拿下大模型

  雷军上次高调挖人还是做小米汽车的时候,对大模型的重视可见一斑。

  AI Agent 在智能手机上的应用逐渐成为常态,未来通过 AI Agent 为用户高度定制化的私人助理,这一趋势将成为品牌维护用户群体的核心护城河。

  而相比友商,小米在 AI 大模型上的真正发力确实有点晚,虽然 2016 年它便组建了 AI 团队。

  你知道小米小爱目前用的哪家模型:小米大模型?文心一言?阿里通义?字节豆包?

  大概是:全都有。

  2023 年 4 月,小米 AI 实验室下设了专门的大模型团队,任命栾剑担任负责人,向小米技术委员会副主席、AI 实验室主任王斌汇报。同年 11 月,AI 实验室主任王斌接受采访时,明确表示过小米不做 ChatGPT、不搞 AI 的军备竞赛。

  对于"烧钱"的预训练大模型,小米相较于其他厂商更显谨慎。其中也有同步造车,要优先保住"现金王"在成本上的考虑。

  内部认为,轻量级模型亦有其存在的市场空间,且在某些特定任务上相比千亿大模型亦能具备一定的优势。

  作为对比,2023 年 11 月,友商 Vivo 已经推出第一代蓝心大模型矩阵,包括十亿、百亿、千亿三个参数量级的五款语言大模型。

  同年的年度演讲中,雷军宣布小米将全面拥抱 AI 大模型,大模型技术的主力突破方向只是「轻量化」和「本地部署」。

  小米几乎是全球,拥有最丰富 AI 入口和应用场景的公司。2024 年 Q3 财报显示,小米集团的 AIoT 平台已连接的 IoT 设备数超 8.61 亿,同比增长 23.2%。

  被称为"杂货铺"的小米,这些海量的 AIoT 设备,轻量化、需要借助分布式算力的终端设备,目前主要依赖于云端的 AI 能力,想要实现本地化部署,对于轻量化的需求确实更高。

  2024 年底,荣耀 CEO 赵明在发布会上,用手机 AI 点了 2000 杯瑞幸咖啡。这种"自动驾驶"式的手机功能引发了热议。

  而小米 15 与竞品相比,虽配备基础 AI 功能,但是在多模态交互与跨 App 联动等方面的应用,就有些乏善可陈,宣传上也略显不足。

  如今国产手机价格已经迈过 4000 元大关,各家厂商芯片算力不断提升,AI Agent 与手机硬件的融合已势不可挡。AI Agent 在人机交互中显得尤为重要,AI 的加持与否,也将成为区别手机高低端的关键。

  另据 IDC 预测,2025 年中国新一代 AI 手机市场出货量将达 1.18 亿台,同比增长 59.8%,整体市场占比达到 40.7%。

  在其他手机厂商 All in AI 时,小米警觉自己已经默默地落后了。为了拿下新一轮的高端智能手机军备,小米必须加注大模型也是势在必行的事情。

  03 人才先行

  雷军曾表示,小米将继续加大在 AI、物联网(IoT)等前沿技术的投入,力争在全球科技创新中占据一席之地。

  2017 年,小米正式成立 AI 实验室。在 AI 领域,小米已经发布了自研芯片澎湃 C1、成立自动驾驶团队、小米机器人实验室,去年其 AI 相关团队已经超过 3000 人。

  近期小米大模型也已升级至第二代。目前,MiLM2 已经在澎湃 OS、小爱同学、智能座舱、智能客服中应用落地。

  ▲图源:小米发布会

  在大模型领域,小米其实是有优势的,其"人车家"战略最不缺大模型的落地场景,其中汽车领域的大模型实践,既是体验赋能、也是落地样板,一旦储备了丰富的人才和技术积累,把这块短板补上来,无数的应用场景能迅速反哺大模型的能力。

  这样看来,小米大模型的上限会很高。

  如何将"轻量化"和"本地部署"战略真正转化为用户可感知的体验差异,并在多样化场景中形成闭环生态,是小米必须回答的新课题。

  AI 人才对整个产品举足轻重,在雷军给出发力大模型的信号之后,相关人才的招募正在如火如荼的进行。

  随着罗福莉以及更多的人才加入 AI 版块,小米奋起直追还不算晚,至于能不能像小米汽车一样惊艳全场呢?还有待实践验证。

  另据 12 月 26 日界面新闻报道,小米正在着手搭建自己的 GPU 万卡集群。而小米大模型团队在成立时已有 6500 张 GPU 资源。

  值得注意的是,字节跳动和腾讯,在 2024 年采购的英伟达 GPU 都超过 20 万张。看来,小米在买卡方面还得努力努力再努力。