两笔10亿美元大模型融资,互联网大厂又开始抢项目了

两笔融资超过去年中国大模型领域融资总额。

  文丨王与桐

  编辑丨程曼祺

  2024 年刚开启 1 个多月,中国大模型领域的资本竞争进入新阶段。

  《晚点 LatePost》获悉,大模型创业公司月之暗面(Moonshot AI)近期完成了超 10 亿美元 B 轮融资,投资方包括阿里巴巴、美团、小红书和红杉中国等。本轮结束后,月之暗面估值超过 23 亿美元。

  这是目前中国大模型领域的最大单轮融资,但这个记录不一定会保持太久。

  据了解,另一家大模型头部公司也在进行金额达 10 亿美元的新融资,交易已进入后期阶段。

  两笔 10 亿美元融资,加起来已超过去年中国大模型领域的公开融资总额(约 100 亿元人民币)。

  大模型创业公司在争夺所剩不多的氧气:美元基金投资整体低迷,人民币基金更看重确定性,有意愿和实力大手笔投入大模型的主要是大型互联网或科技公司。

  作为有限的投资方,中国互联网大厂也在展开激烈竞争,并已分化出不同动作和策略:一是大量对外投资,服务战略目标;二是暂不出手,集中精力做自己的大模型。

  月之暗面此轮的新股东阿里和美团都属于第一派。

  阿里此前已投资过大模型创业公司智谱 AI 、百川智能和零一万物;美团则投资了智谱 AI,并投资和收购了光年之外。

  广撒网的公司还有腾讯和小米:腾讯去年投资了百川智能、智谱 AI 和 MiniMax 与光年之外;雷军创立的顺为投资了百川智能、智谱 AI 和 MiniMax,其中百川、智谱 AI 也被小米投资。

  百度和字节则尚未投资大模型公司。

  阿里是中国互联网大公司中,投资大模型最激进的一家。

  一位投资人称,在阿里、腾讯同时投资的百川和智谱 AI 中,阿里的占股都更高。此次阿里又参与了金额超 10 亿美元的月之暗面新融资。

  动作的区别来自不同的战略意图和坚定程度。

  阿里在 2023 年已形成了相对清晰的大模型战略:最大目标不是靠自研模型赚钱,而是为一众大模型提供云计算能力,把握成为 AI 算力基础设施的机会。

  硅谷风投机构 a16z 的调查发现,大模型和生成式 AI 创业公司 80%-90% 的早期融资都用于向云计算平台购买算力;a16z 估计,未来行业更成熟时,模型和应用公司每年也要把 10%-20% 的营收送给云计算公司。相当于一笔 “AI 税”。

  收取 AI 税的方式之一是与有潜力的大模型公司,即 AI 算力买方深度合作:如微软去年初承诺投资 OpenAI 100 亿美元,其中大部分是以云计算资源而非现金结算;Google 和亚马逊也在去年承诺给 Anthropic 投资共 60 亿美元,Anthropic 将在四年内花费超 30 亿美元购买 Google 云计算服务,同时也会购买亚马逊的云计算服务。

  重金投资大模型,有助于阿里云继续巩固中国第一的市场地位和抓住 AI 计算带来的增量。

  对比阿里,腾讯投资力度更弱,可能有两个原因:一是云计算业务对腾讯的重要性不如阿里,CSIG(腾讯云与智慧产业事业群)过去两年一直在精简人员;二是腾讯希望更聚焦地做好自己的混元大模型。

  尚未投资大模型创业公司的百度和字节各有各的逻辑。

  据百度 2023 年 Q3 财报,期末的现金及现金等价物不到 350 亿元人民币,而字节同期的现金储备超 300 亿美元。

  有限的资源下,百度的优先级是做好自己的大模型和相应产品。一位接近百度的人士称,百度去年已明确了不投大模型公司,重点关注应用公司。

  掌握大量可投资金的字节跳动则几经摇摆。

  据《晚点 LatePost》了解,字节在 2023 年上半年一度考虑投资大模型公司 MiniMax 和阶跃星辰,但最终未出手。

  2023 年年中,字节决定不再投资大模型公司,而是集中精力做好自己的大模型,这是字节抓住 AI 时代超级 App 机会的关键。

  而就在最近,字节再次接触头部大模型公司,重新评估投资必要性。

  背景是,字节自己开发大模型的进度没有达到预期;阿里的激进出手和近期暗流涌动的大模型投融资竞争也带来了一定压力。

  OpenAI 上周刚刚发布的视频生成模型 Sora 则是一个新冲击。

  此前市场的一种观点是,拥有抖音、TikTok 的字节和拥有 Youtube 的 Google 掌握大量视频数据,更有优势做出视频多模态模型。

  而 Sora 的强悍表现显示,足够强的大语言基础模型可以覆盖图片、视频等其它的模态能力,模型技术能力可能比数据资源更重要。

  原本掌握现成内容或社交产品,进而掌握海量数据的大型互联网科技公司都不得不重新掂量自己能否领先。“字节现在可能有点慌,它们之前手里没有投资的牌。” 一位从业者说。

  此次被阿里、美团等投资的月之暗面成立于 2023 年 3 月,由清华大学交叉信息研究院助理教授杨植麟创立。

  今年 32 岁的杨植麟本科毕业于清华大学计算机科学与技术系,后在卡内基梅隆大学语言技术研究所(LTI)攻读博士。这期间,他作为第一作者发表了 Transformer-XL 和 XLNet;前者是首个全面超越 RNN 的注意力语言模型,后者则在 20 项任务上超越了 Google BERT 模型。杨植麟本人学术引用量自 2019 年起已超 2 万余次。

  接近杨植麟的多位投资人评价他:罕见地聪明,成长速度惊人。月之暗面的特色是聚焦中文、长文本以及 To C 产品驱动。在 2023 年 10 月,月之暗面发布的首个模型 Moonshot 和智能助手 Kimi 能支持 20 万汉字的输入,是 Anthropic 的 Claude 2 -100k(约 8 万字)的 2.5 倍,OpenAI 的 GPT-4-32 K(约 2.5 万字)的 8 倍。

  一位 AI 从业者称,在去年下半年这个时间点,月之暗面也是中国头部大模型公司里投资性价比相对高的一家:它在去年 10 月的 20 亿元人民币 A 轮融资后,估值约为 8 亿美元,低于当时估值已接近 20 亿美元的 MiniMax 和智谱 AI 以及已是独角兽的百川智能。

  单轮 10 亿美元的融资,往往不会发生在一个行业的早期。即使是融资繁荣的上一波 AI 热潮中,商汤累计融到 10 亿美元也用了 4 年,旷视用了约 7 年,而月之暗面刚刚成立 11 个月。

  反常的投入力度背后是超常的大机会和投资者的超高期待。阿里、美团等此次对月之暗面的 B 轮投资,可能会如一颗火星那样引爆早已弥漫的 FOMO(Fear of Missing Out,害怕错过)粉尘。

  题图来源:《复仇者联盟4:终局之战》