国思软件 - 大模型公司门口，挤满了送钱的投资人

　　文 | 白鲸实验室

　　今年大模型公司最大的变数之一，是 DeepSeek 也开始下场融资。这意味着，即使是理想主义者梁文锋，也走到了新的认知拐点。

　　不过与其他模型公司不同，梁文锋即便是融钱也不是为了尽快商业化。最近彭博援引知情人士称，梁文锋在至少一次投资者会议上承诺，公司会优先考虑技术突破，追求更大的目标，实现 AGI，而非实现盈利和短期商业化。

　　备受资本追捧的不只 DeepSeek，还有 Kimi、阶跃星辰，甚至二级市场的智谱和 MiniMax，今年上半年，都在资本市场获得数倍的估值跃升。

　　过去三年，大模型的投资浪潮至少掀起过两轮资本高峰。从参与的机构、募资金额以及决策时间上看，2026 年的资本潮水，无疑都更猛烈，也更集中。在投资什么样的模型公司上，投资人心中都有自己的那杆秤，但一个共识越来越明确，AI 带来的是范式革命，顶级模型公司会成为最大的链主企业。

　　01 最后几张船票

　　想给 DeepSeek 投钱的人已经排成队。“最近许多认识的不认识的 LP 找到我，想要投资 DeepSeek，找过来的至少 40 亿资金，”一线投资机构的投资人李思扬（化名）说，确实很疯狂，很多人都想进来。

　　4 月，DeepSeek 要融资的消息一经传开，立刻在投资圈炸开。一线投资人们各显神通，试图接近 DeepSeek 融资核心地带的人打探各种消息。甚至大部分根本不掌握融资细则的 DeepSeek 员工，都能收到一堆投资人请求见面的邀约，更不用提梁文锋本人。一位 DeepSeek 员工告诉我们，他根本不敢出门见人。

　　高信资本创始合伙人兼董事长曹斌面对外部采访时丝毫没有掩饰自己的情感：“如果有机会可以投资 DeepSeek，我们是非常非常愿意投资的”。

　　但事实上，大部分财务投资者都不在 DeepSeek 的考虑范围之内。4 月 23 日，我们独家报道 DeepSeek 这轮融资估值高达 3000 亿，折合美元 440 亿。此次融资不是面向普通财务投资人，主要还是以国家定向基金为主，对 LP 都有身份要求。

　　李思扬所在的投资机构，曾通过非常高层渠道打听到 DeepSeek 的融资情况，但是碍于其融资条件的苛刻，也被拒之门外。

　　“如果 DeepSeek 开放门槛，无论需要多少钱，基本上都能找到。谁都知道，DeepSeek3000 亿的估值，肯定值得投。”李思扬说。毕业于海外名校计算机专业的李思扬，拥有敏锐的技术视角，过去几年也参与国内外多家头部模型公司的融资。去年 Kimi 在宣布融资时，她就力推机构接连多轮买入了 Kimi。

　　大模型的竞赛本质是人才、金钱、算力等全方位比拼。一个上万亿参数的模型训练需要涉及硬件、算法、数据和电力等，仅硬件上的 GPU 投入都是数亿美元打底。模型公司竞赛进行了三年多，能继续留在牌桌上的独立通用模型厂商只剩几家，除了 DeepSeek、Kimi，还包括 AI 六小虎里的阶跃星辰，和已经上市的智谱、MiniMax。

　　后续很难再有新的模型公司加入。对于充满 FOMO 情绪的投资人而言，顶级模型公司的稀缺性，决定了无论最终抢到哪一家，都可能是这一轮 AI 时代最后的上车机会。

　　3 月 Kimi 启动最新一轮融资，原计划融资 10 亿美元，结果融了 20 亿美元，超募 10 亿美元。估值也较之前的三个月翻了 4 倍多。4 月，一家专注泛汽车科技领域的产业投资机构合伙人四处打探印奇的电话，想要直投进去一个亿。他没有尽调，对 AI 了解也不多，但他认为“只要上市，阶跃星辰的估值就会上涨到 2000 亿。”

　　智谱、MiniMax 上市后，资本市场对“大模型核心资产”的追捧被进一步放大。两家公司在二级市场的估值一度出现 5 至 7 倍级别的上涨，也让整个行业重新进入一种强烈的 FOMO 情绪。而目前国内仍未上市的几家头部模型公司中，除了 DeepSeek 之外，Kimi 和阶跃都已不同程度释放出 IPO 计划或资本化信号。

　　随着二级市场不断给予高溢价反馈，一级市场对于大模型公司的估值逻辑也被进一步推高。阶跃紧跟 Kimi 的融资节奏，5 月 8 日，宣布最新完成 25 亿美元融资，加上今年 1 月开启 Pre-ipo 融到 50 亿人民币，阶跃在三个月的时间里估值也上涨了两倍。

　　乐观的情绪几乎表现在募资的整个流程。从投资决策流程都在提速。传统 VC 投资需要长周期、尽调，现在从 LP，到 GP，尽调的时间都不充足。市场上能直接拿到份额的大投资机构，不得不先锁定部分份额，边尽调边募资，甚至被迫参与两轮、乃至多轮的投资。

　　去年底，一家投资机构拿到一家模型公司份额，只差最后 800 万美元。它们为此开展一次路演，路演结束不到 24 小时，钱已全部到账。现场 LP 热情非常高涨，甚至在没有来得及签署投资协议的情况下就打款了。

　　投资人根本没有犹豫的机会，如果提前没有更多的了解，只能闭眼买入或者错失机会。

　　市场上罕见出现同一轮融资，双估值的结构，约定好的份额价格也时刻发生变化。阶跃星辰今年以来展开 Pre-ipo，产业资本、关系好的投资人买入价格的是 40 亿美元估值，财务投资人进入的是下一轮，原本约定的估值价格是 60 亿，但实际上 4 月这轮进入的财务投资人买入的价格就高到了 80 亿、90 亿美元，足足上涨了两倍。

　　不少投资人吐槽“这很疯狂”，抱怨阶跃星辰的创始人印奇坐地起价。

　　达晨财智董事总经理张英杰告诉我们，这是供需关系决定的，市场钱多，能投的模型标的就那么几家，大部分投资机构的心态是只要能抢到名额，就会投进去。他给出的最明显案例是，今年以来，头部公司在基本业务没有本质的变化同时，估值涨了3-5 倍。

　　02 模型正迎来认知拐点

　　对许多投资人而言，Kimi 与阶跃星辰是当前市场上唯二能上车的基础模型投资标的。相比之下，DeepSeek 无疑是更具吸引力的选择，但由于其融资节奏、对外开放程度以及份额稀缺性，普通投资人接触到的机会微乎其微。

　　在仅有的两家公司里挑选，押注 Kimi，对很多投资人来说几乎不需要太多犹豫。"好公司的逻辑，就是应买尽买"。投资人李思扬说，当 Kimi 有 100 亿美元估值时，不能闭眼打钱的投资人都是没有看懂 AI 的人。

　　这种判断背后并不只是情绪。Kimi 至今仍是国内少数真正建立起用户规模的 AI 产品之一。除了大厂 AI 助手和 DeepSeek 之外，它依然保持着不错的C端用户基数。同时它的模型性能在海内外的口碑也不错。AI coding 神器 Cursor 发布的 Composer 2 模型底座，就来自 Kimi 的 K2.5 模型。

　　对于今年以来动作频繁的阶跃星辰，部分投资人的感受有些失焦。无论从C端产品还是 all in agent 终端来看，阶跃星辰留给外界的印象并不深刻。一位相对谨慎的 LP 郑明告诉我们，从今年 1 月开始，他们曾试图从实际业务场景上去了解这家公司的模型能力，但是四五个月下来，仍很难从外部建立起清晰感知。

　　去年，阶跃星辰主动收缩C端业务，角色扮演产品“冒泡鸭”停运，只留下 AI 助手工具阶跃 AI。同时在 TO B 上，全面转向终端场景，包括汽车、手机和具身智能。阶跃对外打造“AI + 终端”的战略叙事，放弃大模型当前最火热的纯 API 调用商业化模式。

　　这种路径确实吸引了一批专注终端的公司。比如全球头部手机 ODM 厂商华勤技术，专注电子设备制造的龙旗科技，图像传感器领域的核心供应商豪威集团，以及横跨通信设备与终端的中兴等。

　　但对郑明来说，这种战略对普通投资人的吸引力不大。他判断投资一家公司的关键是，能否在真实场景中直接感知模型能力。而阶跃当前对外开放的产品规模较小，用户反馈有限。他甚至专门体验了阶跃星辰与吉利汽车合作推出的智能体座舱，依然没有形成足够深刻的感知。最终他没有选择投资阶跃星辰。

　　李思扬所在的机构也没有买入阶跃，她的核心逻辑是，模型能力仍然是第一位的竞争变量。在她看来，眼下仍然是模型即产品的关键阶段，模型性能正迎来认知的拐点。去年年底以来，她频繁和模型公司的朋友接触，一个共识在极少数的科学家圈层已经形成，那就是模型已经开始具备某种“自主研究能力”。它们不仅可以实现自我训练，自己找问题，还能设计 coding 的单元，自己提出科学假设，然后验证。

　　这意味着，模型正在从工具演化为真正意义上的“研究系统”。

　　最明显的案例是去年 11 月，Anthropic 最新模型 Claude Opus 4.5 表现出的“自主进化能力”。其团队在实测中发现，Opus 4.5 的理解能力明显优于以往模型，不仅能发现以前模型无法发现的 bug，还可以自主判断什么时候行动，权衡复杂决策。

　　Anthropic CEO Dario Amodei 在今年 1 月接受媒体采访时，也提到最新模型 Claude Opus 4.5 推出后，AI 端到端完成复杂任务的能力已经到达拐点。模型自主提升能力也加速了模型迭代。Anthropic 的 Claude Opus 模型发布节奏，由此前的 3 个月一迭代提速到两个月。去年 11 月，Anthropic 发布 Opus4.5 后，2 月 5 日 Opus 4.6 更新发布，4 月 17 日 Claude Opus 4.7 正式发布。

　　Anthropic 今年 1 月发布的桌面 agent 工具 Claude Cowork，掀起了国内对桌面 agent 工具的热潮。Amodei 承认，这个工具几乎完全由 Claude Opus 模型自主开发，仅花了一周半的时间。

　　模型具有自主理解力不仅意味着研发人员和工程师代码效率的提升，更意味着 AI 系统的能力边界突破后，会带来前所未有的变化。李思扬说，“二三十年前，世界上规模最大的公司可能是百亿、千亿美元级别，而 AI 时代，我认为这些模型公司的上涨空间会非常大，超乎人类的想象。”

　　而资本市场，也正在用收入增速重新定价这些公司。Anthropic 已经跃升为近万亿美元公司，其最新公布二季度的收入增速约为 127%。该公司预计将在 6 月当季实现 5.59 亿美元的运营利润。据研究机构 SemiAnalysis 的最新分析，Anthropic 的推理毛利率已从 38% 跃升至 70% 以上，年化收入在数月内从 90 亿美元飙升至逾 440 亿美元。

　　类似的增长，也开始出现在国内模型公司身上。随着 K2.5 模型发布后口碑持续提升，Kimi 的年度经常性收入（ARR）在今年 3 月突破 1 亿美元，并在 4 月进一步增长至超过 2 亿美元。短短一个月时间收入几乎翻倍。同样的增速，在当前的 AI 应用上几乎很难找到。李思扬说，模型公司会成为 AI 行业最大的链主公司，这已经成为业内的共识。

　　03 大厂广撒网

　　每一轮的技术热潮中，最活跃的投资人非大厂莫属。最近几年，腾讯和阿里几乎联手投资了 AI 六小龙里的至少 5 家基模公司，尽管有些已经掉队。

　　阿里是投资大模型公司最多的大厂。2025 年 12 月以来，阿里参与了 Kimi 的多轮融资，在c++轮融资额度上，阿里是领投方。

　　外界不知道阿里最终在 Kimi 上投入多少金额，不过阿里一向被视为 Kimi 的最大外部股东。早在 2024 年年初，阿里以 8 亿美元投资了 Kimi，创下了大模型公司最大单笔融资股东记录。当年 3 月，阿里还投入 4 亿美元，领投了 MiniMax 的的B轮融资。

　　Kimi 的老股东是美团龙珠，从 2023 年领投 Kimi 的A轮后，美团龙珠一直参与其多轮融资，最近D轮融资更是领投了 2 亿美元。美团龙珠投资 Kimi 的逻辑和李思扬相似，看中的依然是 Kimi 团队的技术前瞻性。美团龙珠的合伙人王新宇，多次对媒体讲述他第一次见到杨植麟后的印象，杨植麟对模型的认知非常接近第一性原理，整体团队技术前瞻性很强。

　　除了美团龙珠，Kimi 还吸引了新入的财务投资者全球 vc 机构凯辉基金。这家管理欧洲有史以来最大 AI 基金公司，更偏好从 AI 如何重构行业底层逻辑的角度，去投资 AI 垂类应用或者软硬结合的产品。过去几年来，它从未参与大模型的投资，但是在 2026 年，它在中国投资的首个模型公司就是 Kimi。

　　公开披露的资料显示，阿里是投资大模型公司最活跃的大厂，几乎投资了除阶跃星辰外的其余所有基模公司（DeepSeek 股权份额目前尚未确定）。阿里是 MiniMax 的重要外部股东，上市前持有 13.66% 的股份，目前 MiniMax 披露的数据显示，阿里持股有 17%。阿里还持智谱（上市前）约6% 股份，还是已经掉队基模的百川智能、零一万物的股东。

　　唯独印奇担任董事长的阶跃星辰没在阿里投资的名单当中，让人颇感意外。要知道在 AI1.0 时代，阿里曾多次投资印奇创立的旷视科技，是旷视早期重要的战略投资方之一。旷视科技先后冲刺港股与 A 股科创板，均因实体清单、监管与持续亏损等原因未能完成上市。

　　阿里的真金白银买入，很大程度上是为了算力捆绑。早在 2022 年，MiniMax 一直使用阿里云提供的云端服务。2025 年年报披露，未来三年 MiniMax 每年向阿里云采购交易金额高达 1 亿多美元。

　　智谱同样与阿里云签署了深度战略合作协议。智谱的多个版本模型直接在阿里云百炼平台首发，并作为核心模型上架。为保障 Kimi C 端产品业务在高峰期的高并发请求，Kimi 与阿里云深度合作，阿里云为其构建了一套端到端的 Agent Infra 基础设施体系。

　　模型性能层面，腾讯自研大模型相较于字节豆包、阿里通义千问仍存在差距。但过去半年，腾讯秉持应投尽投的思路布局外部 AI 模型赛道。其入局大模型投资的节奏略晚于阿里，但投资覆盖面更广，主流大模型创业公司基本均有涉猎。

　　今年以来，腾讯和阿里领投 Kimi 的C轮融资、C++轮融资。另外腾讯还重仓了阶跃星辰，在阶跃星辰今年的两轮融资中，腾讯作为老股东也参与了，据公开信息统计，腾讯至少参与了阶跃星辰三轮融资。

　　腾讯的角色也早已超出财务投资范畴。2026 年 4 月，腾讯云与阶跃星辰正式签署战略合作，明确将 AI 模型与腾讯音乐、视频、地图等服务深度整合，腾讯的角色也从单纯财务投资延伸至产业协同与产品落地层面。除此之外，腾讯在更早阶段也已布局多家头部模型公司，包括 MiniMax 与智谱。例如在 2023 年 8 月智谱 AI 的 B4 轮融资中，腾讯出资约 2 亿元。2024 年 12 月，又继续参与其约 30 亿元规模的新一轮融资。

　　总体而言，腾讯在基础大模型层面一直落后，但在投资模型厂商方面的动作不比阿里少。阿里更倾向于自己做底座，试图在模型层建立统一技术栈，而腾讯更倾向于通过资本与生态绑定多家模型公司，确保自己至少参与了这一轮模型竞赛。

大模型公司门口，挤满了送钱的投资人

我们的产品

相关链接

关于我们

联系我们