究竟该如何给DeepSeek估值

  作者 | 王兆洋

  邮箱 | wangzhaoyang@pingwest.com

  三周之内,在公开报道里 DeepSeek 的估值四次改写:

  4 月初约 100 亿美元“启动融资”,4 月 22 日的报道称其估值超过 200 亿美元,5 月 6 日传出“大基金”洽谈领投,估值约 450 亿美元,而上周最新传出的估值上限是超 500 亿美元——若成真,这会是中国 AI 公司有史以来最大的单轮融资。

  而根据报道,此轮融资中最大的一张支票,不是来自 VC 或互联网巨头,而是来自 DeepSeek 创始人梁文锋本人:他个人可能出资最高 200 亿元人民币,占融资总额的 40%,据称,他通过增资将直接持股从1% 提升至 34%,加上间接持股,合计控制约 84.29% 股权。

  而全称国家集成电路产业投资基金的“大基金”,投出过中芯国际、长江存储的半导体产业核心资本,此前从未公开注资大语言模型厂商,一旦本轮融资落地,也将是首次。

  DeepSeek 过去最鲜明的标签之一就是不融资、不商业化、不路演,因为母公司幻方量化的资金储备一直够用。它商业化方面的主动动作几乎为零,也让这种高估值对比其他模型公司已经挺夸张的“市梦率”时依然显得神奇。

  当你把这些事实放在一起,会发现用模型公司的框架解释不了这一次备受关注的融资——为什么估值能在三周翻五倍?为什么大基金会进来?为什么创始人自己出最大那笔钱?

  这次融资需要另一套框架才能读懂。

  DeepSeek 不是又一家“更好的模型公司”,它更像是一家长得像模型公司的基础设施公司。这个定位在这次融资里彻底体现出来。

  1

  梁文锋 2024 年谈到融资时说过一句话:“我们面临的问题从来不是钱,而是高端芯片被禁运。”

  模型公司的核心命题是数据、算法、人才,芯片是成本项,不是战略项。把芯片说成核心问题,意味着 DeepSeek 从第一天起除了思考“怎么把模型做得更好”外,更多注意力就已经放在“怎么在算力受制于人的条件下重建一套能跑起来的东西”。

  如果回溯 DeepSeek 所有最重要的技术创新,从 MLA 到 MoE,从 FP8 训练到极致推理效率,本质上都是同一个问题的不同解法:怎么用更少、更受限的算力,做出顶级模型。这已经从模型公司的思考方式变为基础设施公司的研发逻辑。

  如果 DeepSeek 不是模型公司,该给它什么定价?参考谁?答案不是 Kimi,不是智谱,不是 MiniMax。此次传出的融资结构可以给出判断思路。

  2

  4 月 24 日,DeepSeek-V4 发布,技术报告第一次把华为昇腾 NPU 和英伟达 GPU 写进同一份硬件验证清单——“我们在英伟达 GPU 和华为昇腾 NPU 两个平台上均验证了细粒度 EP 方案”,万亿参数级别的模型,第一次在正式文档中完成了对国产 AI 芯片的官方认定,发布当天,包括华为昇腾、寒武纪在内的 8 家国产芯片即完成适配,打破了以往需要数月调试的惯例,而为了这一行字,DeepSeek 团队过去数月与华为及寒武纪密切合作,一些报道称这也是它专门推迟发布计划的重要原因。它对模型底层进行了大量调整与重写。

  而融资就在这期间启动:时间点很有意思,其他公司融资是为了做到某件事,DeepSeek 融资是因为某件事已经做到了,而且是以公开可验证的方式做到的,相当于梁文锋用一个模型发布,完成了通常需要几轮会议才能完成的尽职调查。

  而接下来的融资里其实有三笔钱,三种逻辑,互不交叉。

  大基金——全称国家集成电路产业投资基金,半导体行业最重要的国家级产业资本——历史上的投资对象是中芯国际、长江存储,它投的是”中国不能没有”的半导体基础设施。大基金的使命是补齐半导体制造、设备与材料的硬件短板,大模型公司此前从未进入它的射程。

  它此前之所以对投模型公司有顾虑,就是模型的商业回报周期不确定,用投半导体的逻辑投模型说不通。而现在这被 DeepSeek 用一个动作解开,V4 用国产芯片适配证明了它不是一个模型公司,大基金现在可以用另一套语言描述这笔投资了,投的是国产算力生态能不能跑通这个战略节点,用顶尖模型带动国产算力的应用迭代,构建“国产芯片+国产模型”的自主闭环——这件事在它的逻辑里,和投中芯国际是同一类问题。

  传言中很可能入股的腾讯等产业资本那部分,则是另一套动机:确保自己不被排除在中国 AI 基础设施之外,因为如果 DeepSeek 最终成为那个底层,不在股权结构里意味着身份只能是付费用户,而它带来的不只是钱,是生态入口、企业客户、云资源——恰好是 DeepSeek 商业化最薄弱的地方。

  这也解释了其他同样有基础设施野心的另外几个大厂,可能最终不会入股的原因。DeepSeek 已经被视为潜在的基础设施竞争对手,而不只是一家可以入股的模型公司。

  3

  这就带来一种“割裂”感:一边锁定国家战略资本,确认基础设施身份;一边引入产业生态资本,打开商业化入口——这两件事在很多时候在很多公司身上会是矛盾的,但从这次融资结构来看,DeepSeek 试图让它彼此完全独立运转,互不拖累。

  也就是说,DeepSeek 的融资之后,商业化进展快慢,和宏大叙事能不能做成,彼此不相干。

  大基金那部分对应的是长期命题——算力自主、国产芯片生态,时间周期是五年十年,不需要季度回报;腾讯等产业资本对应的是另一条线,商业化节奏紧跟其他模型公司即可。

  在人们讨论它商业化困境的时候,似乎总是忽略一些事实:DeepSeek 的 API 定价已击穿行业底线——V4-Flash 缓存命中输入低至 0.02 元/百万词元,综合成本仅为 GPT-5.5 的1% 左右,推理成本被压到这种地步,让 DeepSeek 可以保证自己 API 这门生意本身不亏钱;而 a16z 最新一版《Top 100 Gen AI Consumer Apps》报告里,DeepSeek 依然是跨越了中美用户分布的产品——网页流量在中国(33.5%)、美国(6.6%)之间分布,在模型更新“拖累”了应用迭代的情况下,移动端用户基本盘没有出现外界以为的那种崩塌。这意味着理论上其他模型公司能赚钱的方式它都能跟上,而且边际成本更低。

  其实这种割裂,是 DeepSeek 区别于其他公司的一大特质,是他主动设计出来的,而且从幻方时代就存在。

  幻方量化赚钱,DeepSeek 做研究,这是它从第一天就运行的结构。幻方不需要 DeepSeek 给它带来商业回报,DeepSeek 不需要向幻方证明自己的 ARR 增长——这种关系,外人很难找到对应的参照,更接近一家自营交易公司决定把利润投进基础研究:研究本身就是它存在逻辑的一部分,不是一个待变现的项目。

  这种割裂依赖的就是梁文锋一个人同时握着两边的方向盘,但其实越往后,这越是脆弱的,它是人格化的,不是结构化的——一旦外部资本进来,平衡被打破的风险第一次真实存在。

  所以这次融资在做的反而是把这种依赖个人意志的割裂,第一次变成股权结构里写死的东西。幻方和 DeepSeek 之间的那种关系,被复制到了一个更大的尺度上:幻方对 DeepSeek 是第一层割裂,DeepSeek 内部商业化对算力基础设施研究是第二层割裂,两层割裂有同一个逻辑和同一个设计者。

  因此,此次融资里,在这两笔钱之外,更独特的就是第三笔钱,梁文锋自己的出资。

  报道称,梁文锋个人出资最高 200 亿元人民币,约 28 亿美元。与之对比,月之暗面 Kimi 刚完成的这轮融资总额约 20 亿美元——也就是,梁文锋自己一个人出的钱,已经够匹配大多数模型公司单独一轮融资了。

  所以外部那 60% 进来,不是为了让 DeepSeek 作为模型公司“活下去”或者“继续训练模型”,幻方的钱够,梁文锋自己的钱也够。每一个外部投资方进来,都是因为 DeepSeek 不再是个模型公司了。

  而这笔个人出资买的是对整个结构的锁定权,无论引入多少外部资本,核心决策不会被稀释。

  4

  另外,此次融资此前被外界认为的最大原因是人才流失。但仔细观察后,会发现它的人才流失情况可能被夸大了。

  走的人确实重要——王炳宣去了腾讯,郭达雅去了字节跳动 Seed,罗福莉被以千万年薪挖至小米,阮翀加入了元戎启行,覆盖基座模型、推理、OCR、多模态四条核心技术主线。

  但根据《财经》最近整理的非常详尽的一份数据看,27 篇论文出现频率最高的 15 人里只有 2 人离职,DeepSeek-LLM 发布时的 86 人,仍有 71 位出现在 V4 论文名单中,300 人走 10 个,离职率 3.3%——关注 AI 公司们人才争夺的人会知道这个数值有多低。

  期权定价对留人有真实价值,但它是融资顺带解决的问题,做正确的长期的事,连留人这件事也在过程中顺带解决了——这其实是理解 DeepSeek 所有决策的一个通用逻辑:它从来不为解决眼前的具体问题而行动,但长期的事做成之后,眼前的问题往往也跟着消解。

  5

  最后,要彻底理解它的融资和估值逻辑,还有一个重要的话题,就是 DeepSeek 的竞争对手究竟是谁。

  英伟达定义了 AI 时代算力的游戏规则,所有模型公司——无论中美——都活在这个边界里,而 DeepSeek 是一家试图重新划定这个边界的公司,V4 昇腾适配落地的那一刻,是这个判断第一次被公开验证。DeepSeek 最在意的是英伟达。

  500 亿美元估值,定价的不是当前的模型能力,不是 ARR,不是用户规模。全球可比的模型公司:Kimi 刚完成的融资投后估值约 200 亿美元,半年内从 43 亿美元翻涨近四倍,有真实 ARR 支撑;Anthropic 上一轮投后估值 3800 亿美元,年化收入已在 2026 年初突破 300 亿美元。DeepSeek 商业化收入基本为零,估值去到 Kimi 两倍以上——而且这笔钱里最大的一部分来自半导体国家基金,不是来自押注模型公司未来 ARR 的成长型 VC。

  从投资人结构本身就能看出,差价定价的不是商业化预期,是基础设施溢价。

  如果 DeepSeek 做成了它试图做的事——一套不依赖英伟达的前沿 AI 算力体系,一个以开源为基础的中国 AI 基础设施——比较对象应该是某个介于星际之门版的 OpenAI 和英伟达之间、目前还没有被定义过的位置:既做顶级前沿模型,又试图用新方法解决算力基础设施问题,全球找不到第二家这样的公司。

  从这个坐标系看,500 亿美元破纪录,但还是便宜的。

  此次融资,定价的是一件还没有发生的事。这件事能不能发生,取决于梁文锋能不能做成他从第一天就在做的那件事,而从幻方到 DeepSeek 的整个路径来看,他是一个把长期主义执行得极为彻底的人,做正确且长期的事,很多具体的东西会在过程中自然解决。这轮融资可能是他第一次让外部世界看到这件事完整的轮廓。