国思软件 - 究竟该如何给DeepSeek估值

　　作者｜王兆洋

　　邮箱｜ wangzhaoyang@pingwest.com

　　三周之内，在公开报道里 DeepSeek 的估值四次改写：

　　4 月初约 100 亿美元“启动融资”，4 月 22 日的报道称其估值超过 200 亿美元，5 月 6 日传出“大基金”洽谈领投，估值约 450 亿美元，而上周最新传出的估值上限是超 500 亿美元——若成真，这会是中国 AI 公司有史以来最大的单轮融资。

　　而根据报道，此轮融资中最大的一张支票，不是来自 VC 或互联网巨头，而是来自 DeepSeek 创始人梁文锋本人：他个人可能出资最高 200 亿元人民币，占融资总额的 40%，据称，他通过增资将直接持股从1% 提升至 34%，加上间接持股，合计控制约 84.29% 股权。

　　而全称国家集成电路产业投资基金的“大基金”，投出过中芯国际、长江存储的半导体产业核心资本，此前从未公开注资大语言模型厂商，一旦本轮融资落地，也将是首次。

　　DeepSeek 过去最鲜明的标签之一就是不融资、不商业化、不路演，因为母公司幻方量化的资金储备一直够用。它商业化方面的主动动作几乎为零，也让这种高估值对比其他模型公司已经挺夸张的“市梦率”时依然显得神奇。

　　当你把这些事实放在一起，会发现用模型公司的框架解释不了这一次备受关注的融资——为什么估值能在三周翻五倍？为什么大基金会进来？为什么创始人自己出最大那笔钱？

　　这次融资需要另一套框架才能读懂。

　　DeepSeek 不是又一家“更好的模型公司”，它更像是一家长得像模型公司的基础设施公司。这个定位在这次融资里彻底体现出来。

　　梁文锋 2024 年谈到融资时说过一句话：“我们面临的问题从来不是钱，而是高端芯片被禁运。”

　　模型公司的核心命题是数据、算法、人才，芯片是成本项，不是战略项。把芯片说成核心问题，意味着 DeepSeek 从第一天起除了思考“怎么把模型做得更好”外，更多注意力就已经放在“怎么在算力受制于人的条件下重建一套能跑起来的东西”。

　　如果回溯 DeepSeek 所有最重要的技术创新，从 MLA 到 MoE，从 FP8 训练到极致推理效率，本质上都是同一个问题的不同解法：怎么用更少、更受限的算力，做出顶级模型。这已经从模型公司的思考方式变为基础设施公司的研发逻辑。

　　如果 DeepSeek 不是模型公司，该给它什么定价？参考谁？答案不是 Kimi，不是智谱，不是 MiniMax。此次传出的融资结构可以给出判断思路。

　　4 月 24 日，DeepSeek-V4 发布，技术报告第一次把华为昇腾 NPU 和英伟达 GPU 写进同一份硬件验证清单——“我们在英伟达 GPU 和华为昇腾 NPU 两个平台上均验证了细粒度 EP 方案”，万亿参数级别的模型，第一次在正式文档中完成了对国产 AI 芯片的官方认定，发布当天，包括华为昇腾、寒武纪在内的 8 家国产芯片即完成适配，打破了以往需要数月调试的惯例，而为了这一行字，DeepSeek 团队过去数月与华为及寒武纪密切合作，一些报道称这也是它专门推迟发布计划的重要原因。它对模型底层进行了大量调整与重写。

　　而融资就在这期间启动：时间点很有意思，其他公司融资是为了做到某件事，DeepSeek 融资是因为某件事已经做到了，而且是以公开可验证的方式做到的，相当于梁文锋用一个模型发布，完成了通常需要几轮会议才能完成的尽职调查。

　　而接下来的融资里其实有三笔钱，三种逻辑，互不交叉。

　　大基金——全称国家集成电路产业投资基金，半导体行业最重要的国家级产业资本——历史上的投资对象是中芯国际、长江存储，它投的是”中国不能没有”的半导体基础设施。大基金的使命是补齐半导体制造、设备与材料的硬件短板，大模型公司此前从未进入它的射程。

　　它此前之所以对投模型公司有顾虑，就是模型的商业回报周期不确定，用投半导体的逻辑投模型说不通。而现在这被 DeepSeek 用一个动作解开，V4 用国产芯片适配证明了它不是一个模型公司，大基金现在可以用另一套语言描述这笔投资了，投的是国产算力生态能不能跑通这个战略节点，用顶尖模型带动国产算力的应用迭代，构建“国产芯片+国产模型”的自主闭环——这件事在它的逻辑里，和投中芯国际是同一类问题。

　　传言中很可能入股的腾讯等产业资本那部分，则是另一套动机：确保自己不被排除在中国 AI 基础设施之外，因为如果 DeepSeek 最终成为那个底层，不在股权结构里意味着身份只能是付费用户，而它带来的不只是钱，是生态入口、企业客户、云资源——恰好是 DeepSeek 商业化最薄弱的地方。

　　这也解释了其他同样有基础设施野心的另外几个大厂，可能最终不会入股的原因。DeepSeek 已经被视为潜在的基础设施竞争对手，而不只是一家可以入股的模型公司。

　　这就带来一种“割裂”感：一边锁定国家战略资本，确认基础设施身份；一边引入产业生态资本，打开商业化入口——这两件事在很多时候在很多公司身上会是矛盾的，但从这次融资结构来看，DeepSeek 试图让它彼此完全独立运转，互不拖累。

　　也就是说，DeepSeek 的融资之后，商业化进展快慢，和宏大叙事能不能做成，彼此不相干。

　　大基金那部分对应的是长期命题——算力自主、国产芯片生态，时间周期是五年十年，不需要季度回报；腾讯等产业资本对应的是另一条线，商业化节奏紧跟其他模型公司即可。

　　在人们讨论它商业化困境的时候，似乎总是忽略一些事实：DeepSeek 的 API 定价已击穿行业底线——V4-Flash 缓存命中输入低至 0.02 元/百万词元，综合成本仅为 GPT-5.5 的1% 左右，推理成本被压到这种地步，让 DeepSeek 可以保证自己 API 这门生意本身不亏钱；而 a16z 最新一版《Top 100 Gen AI Consumer Apps》报告里，DeepSeek 依然是跨越了中美用户分布的产品——网页流量在中国（33.5%）、美国（6.6%）之间分布，在模型更新“拖累”了应用迭代的情况下，移动端用户基本盘没有出现外界以为的那种崩塌。这意味着理论上其他模型公司能赚钱的方式它都能跟上，而且边际成本更低。

　　其实这种割裂，是 DeepSeek 区别于其他公司的一大特质，是他主动设计出来的，而且从幻方时代就存在。

　　幻方量化赚钱，DeepSeek 做研究，这是它从第一天就运行的结构。幻方不需要 DeepSeek 给它带来商业回报，DeepSeek 不需要向幻方证明自己的 ARR 增长——这种关系，外人很难找到对应的参照，更接近一家自营交易公司决定把利润投进基础研究：研究本身就是它存在逻辑的一部分，不是一个待变现的项目。

　　这种割裂依赖的就是梁文锋一个人同时握着两边的方向盘，但其实越往后，这越是脆弱的，它是人格化的，不是结构化的——一旦外部资本进来，平衡被打破的风险第一次真实存在。

　　所以这次融资在做的反而是把这种依赖个人意志的割裂，第一次变成股权结构里写死的东西。幻方和 DeepSeek 之间的那种关系，被复制到了一个更大的尺度上：幻方对 DeepSeek 是第一层割裂，DeepSeek 内部商业化对算力基础设施研究是第二层割裂，两层割裂有同一个逻辑和同一个设计者。

　　因此，此次融资里，在这两笔钱之外，更独特的就是第三笔钱，梁文锋自己的出资。

　　报道称，梁文锋个人出资最高 200 亿元人民币，约 28 亿美元。与之对比，月之暗面 Kimi 刚完成的这轮融资总额约 20 亿美元——也就是，梁文锋自己一个人出的钱，已经够匹配大多数模型公司单独一轮融资了。

　　所以外部那 60% 进来，不是为了让 DeepSeek 作为模型公司“活下去”或者“继续训练模型”，幻方的钱够，梁文锋自己的钱也够。每一个外部投资方进来，都是因为 DeepSeek 不再是个模型公司了。

　　而这笔个人出资买的是对整个结构的锁定权，无论引入多少外部资本，核心决策不会被稀释。

　　另外，此次融资此前被外界认为的最大原因是人才流失。但仔细观察后，会发现它的人才流失情况可能被夸大了。

　　走的人确实重要——王炳宣去了腾讯，郭达雅去了字节跳动 Seed，罗福莉被以千万年薪挖至小米，阮翀加入了元戎启行，覆盖基座模型、推理、OCR、多模态四条核心技术主线。

　　但根据《财经》最近整理的非常详尽的一份数据看，27 篇论文出现频率最高的 15 人里只有 2 人离职，DeepSeek-LLM 发布时的 86 人，仍有 71 位出现在 V4 论文名单中，300 人走 10 个，离职率 3.3%——关注 AI 公司们人才争夺的人会知道这个数值有多低。

　　期权定价对留人有真实价值，但它是融资顺带解决的问题，做正确的长期的事，连留人这件事也在过程中顺带解决了——这其实是理解 DeepSeek 所有决策的一个通用逻辑：它从来不为解决眼前的具体问题而行动，但长期的事做成之后，眼前的问题往往也跟着消解。

　　最后，要彻底理解它的融资和估值逻辑，还有一个重要的话题，就是 DeepSeek 的竞争对手究竟是谁。

　　英伟达定义了 AI 时代算力的游戏规则，所有模型公司——无论中美——都活在这个边界里，而 DeepSeek 是一家试图重新划定这个边界的公司，V4 昇腾适配落地的那一刻，是这个判断第一次被公开验证。DeepSeek 最在意的是英伟达。

　　500 亿美元估值，定价的不是当前的模型能力，不是 ARR，不是用户规模。全球可比的模型公司：Kimi 刚完成的融资投后估值约 200 亿美元，半年内从 43 亿美元翻涨近四倍，有真实 ARR 支撑；Anthropic 上一轮投后估值 3800 亿美元，年化收入已在 2026 年初突破 300 亿美元。DeepSeek 商业化收入基本为零，估值去到 Kimi 两倍以上——而且这笔钱里最大的一部分来自半导体国家基金，不是来自押注模型公司未来 ARR 的成长型 VC。

　　从投资人结构本身就能看出，差价定价的不是商业化预期，是基础设施溢价。

　　如果 DeepSeek 做成了它试图做的事——一套不依赖英伟达的前沿 AI 算力体系，一个以开源为基础的中国 AI 基础设施——比较对象应该是某个介于星际之门版的 OpenAI 和英伟达之间、目前还没有被定义过的位置：既做顶级前沿模型，又试图用新方法解决算力基础设施问题，全球找不到第二家这样的公司。

　　从这个坐标系看，500 亿美元破纪录，但还是便宜的。

　　此次融资，定价的是一件还没有发生的事。这件事能不能发生，取决于梁文锋能不能做成他从第一天就在做的那件事，而从幻方到 DeepSeek 的整个路径来看，他是一个把长期主义执行得极为彻底的人，做正确且长期的事，很多具体的东西会在过程中自然解决。这轮融资可能是他第一次让外部世界看到这件事完整的轮廓。

究竟该如何给DeepSeek估值

我们的产品

相关链接

关于我们

联系我们