DeepSeek永久降价,其实是瞄准了10万亿美元?

  文 | 字母 AI

  业内一直有这么一个共识,DeepSeek 影响力虽然很大,但 DeepSeek 就是不赚钱。

  说到底,无非就是 DeepSeek 没有订阅、没有额外收费项目,只有 API 收费,可 API 价格太便宜了,而且动不动就打折降价。

  就比如 5 月 22 日晚上,DeepSeek 宣布最新旗舰模型永久降价 75%,从 6 月 1 日开始生效。

  但你有想过这一切背后的逻辑是什么吗?

  亚马逊 AWS 新加坡区域生成式 AI 技术负责人吉里什·迪利普·帕蒂尔(Girish Dilip Patil)在周末写了这么一篇文章,标题是《DeepSeek 的 10 万亿美元大战略》,从业内视角,对 DeepSeek 的底层逻辑进行了剖析。

  文章给出了一个极其反常识的判断,他说 DeepSeek 正在以低价为主要叙事手段,进而在整个 AI 产业链引起一场海啸,彻底瓦解 AI 硬件现有的产业结构,英伟达、SK 海力士、三星、美光等公司将会丧失如今的领先地位,而且部分市场,也会让中国公司取代。

  这 10 万亿美元代表的,就是整个基于 DeepSeek 而牵动的市场机会。

  文章一经发出迅速爆火,它还不止是只在中文圈火,它是直接火遍了整个X上的 AI 圈。

  X 上有一个非常有影响力的 AI 内容博主叫做罗汉·保罗(Rohan Paul),他就转载了这篇文章,并对文章表示了高度的认可。

  国内可能对罗汉这个名字比较陌生,但是他有一个粉丝你肯定认识,那就是皮查伊,谷歌现任 CEO。

  说回文章作者,吉里什不是那种只懂数学或者代码的人,由于工作的原因,他每天都要接触 AI 全栈,因此他是既懂大模型架构和推理,也熟悉 GPU、云服务、企业部署、开发者生态和商业化场景。

  所以他分析 DeepSeek 时,关注点不是“模型”本身,而是从最底层的技术,慢慢谈到硬件,最后上升到整个产业。

  那么文章具体是怎么说的呢?

  01 改写底层逻辑

  我们对“便宜”这个词的理解,主要来自于过去的各种大战,比如网约车大战、外卖大战、共享单车大战等等。“便宜就是抢流量,便宜就是抢市场”几乎刻在了网友们的 DNA 里。

  然而 DeepSeek 的便宜,并非是简单的抢量,它其实是一种“解绑”,让把 AI 不再依赖特定的硬件。

  从 V3 到 V4,DeepSeek 有两件事影响很大,一个是模型记忆,一个是模型推理,不过最终都落到了一个字上,“省”。

  大模型每聊一句,都要把前面的上下文存在 KV Cache 里,而这部分通常吃的是最贵、最紧张的 HBM。

  根据吉里什的测算,在 100 万 token 上下文、8bit KV 精度和 16bit 索引的精度下,DeepSeek V4 的 KV Cache 只占 5.48GB HBM。作为对比,GLM5 要 60GB,Qwen3-235B-A22B 要 89GB。

  差距不只在参数大小,而在架构。DeepSeek V4 的 MoE、MLA、DSA、CSA、HCA 设计,本质上都在做同一件事,把长上下文从“显存黑洞”变成可以被压缩、转存、重新加载的系统工程。

  而一旦 KV Cache 被压缩到很小的规模,那就意味着,模型推理可以更多地放在 SSD、NAND 闪存、LPDDR 内存这些价格亲民的存储介质上,这样你就可以少花点钱去买 HBM,同时这也表示,你不再需要那么多英伟达 GPU 了。

  以前你想入局 AI,那你就得老老实实花大几百万去买英伟达 GPU,钱花出去也就算了,关键是你还得等,因为 HBM 已经严重供不应求。

  现在缺货到什么程度呢?2025 年 11 月下单的 GB200,起码要等到 2026 年第二季度才能拿到货。2022 年特斯拉芯片短缺最严重的时期,一辆 Model Y 最长交付周期也才 24 周。

  一张 GPU,已经比一辆新能源汽车还难造了。

  因此,DeepSeek 的叙事对中国 AI 产业链很重要。

  国产芯片今天最大的机会,未必是正面追平英伟达最顶级 GPU,而是先找到可以真实承接负载的场景。

  DeepSeek 把模型做得更省显存、更适合长上下文、更容易被拆到不同硬件上运行,就等于给国产 GPU、存储厂商、服务器厂商和异构计算框架留出了接口。

  以前英伟达、SK 海力士、三星、美光这些厂商收入暴涨,就是因为 AI 硬件所有的压力全在 GPU 和 HBM 上。

  DeepSeek 把国产厂商拉进游戏里了,可以参与到推理、缓存、存储、调度的每一个环节。

  模型不再只为最强的硬件服务,硬件也不必只有最强的那一类才有价值。中国机会就在这里。

  再看 API 定价策略。

  就在这篇文章发出前一天,DeepSeek V4 Pro 宣布 token 价格 75% 永降,输入 token 价格降至每百万 0.435 美元,缓存命中更是低至 0.0036 美元。

  这个价格比 Claude Opus 4.7 便宜 19 倍,比 GPT-5.5 便宜 12 倍。

  DeepSeek 的降价绝非是赔本赚吆喝,原因在于,在 DeepSeek 开启首次融资后,梁文锋就曾跟投资人表态,要给 DeepSeek 一个健康的商业模式。

  显然他不能让 DeepSeek 亏钱。

  低价 API 本质上是一种生态策略,也是 DeepSeek 在向整个产业链发出信号。

  DeepSeek 仍然在赚钱,但是梁文锋不急着去赚“大钱”,他要做的是让足够多的开发者、企业、硬件厂商围绕这套技术体系做适配和投入。

  原因无他,就是便宜,所以试错成本极低。几百块钱,甚至几十块钱就能适配,那对企业来说可太划算了。

  当生态形成时,DeepSeek 就不是基座模型公司了,它是 AI 基础设施公司,负责制定标准,定义产业,这可能才是梁文锋看重的。

  DeepSeek 的技术选择和商业策略背后,存在着一个清晰的逻辑链条。

  降低模型对顶级硬件的依赖,让更多硬件厂商有参与机会,形成良性竞争;硬件厂商们开始竞争,分散风险并降低整体成本;降低整体成本,支撑更低的 API 价格;更低的 API 价格,吸引更多开发者和应用;更多的应用,产生更大的推理负载;更大的推理负载,就需要更多的数据中心、存储、电力和散热设施。

  这是一个正向循环,DeepSeek 站在这个循环的起点。

  就像当年的 Linux 不靠操作系统授权费赚钱,却撬动了整个开源软件生态。

  DeepSeek 的开源策略、低价 API、技术论文毫无保留分享,都在为同一个目标服务。成为标准,然后在标准之上构建的庞大产业链中获取价值。

  02 从算力到电力

  假如,我是说假如,DeepSeek 真的是想要站在整个 AI 生态的开端,那么宁德时代投资 DeepSeek 这件事,就说得通了。

  虽然我们总是习惯用英伟达来代表 AI 基础设施,但是 AI 基础设施并不等于 GPU,它应该是数据中心、供电系统、散热方案、储能设备和电网调度能力的总和。

  这里有一个反直觉的现象。

  DeepSeek 把推理成本打下来了,按理说应该降低对硬件和电力的需求。实际情况恰恰相反。降本会触发需求膨胀。

  当 API 价格从每百万 token 几美元降到几毛钱人民币,很多过去嫌贵、不敢多用的场景,都会开始大量调用模型。

  使用量的增长速度,会远超单次推理成本的下降速度。最终结果是,总的推理负载不是减少,而是大幅增加。

  需求膨胀的必然结果就是基础设施压力爆炸。

  你要更多的硬件去支撑业务,而这些硬件运作起来就需要更多的电。

  所以到最后你会发现一个事,数据中心的供电能力、散热效率、能源成本,会成为 AI 公司的核心竞争力之一。

  这不是我说着玩的,这是现如今的事实。

  OpenAI 与 AMD 的战略合作协议中,就明确约定了以千兆瓦为单位的算力部署里程碑。

  一千兆瓦是什么概念?相当于一座大型核电站的发电量。说到底,AI 基础设施的竞争,早就是能源竞争了。

  还有一点,AI 数据中心,正在成为新型能源基础设施。

  传统数据中心的负载相对容易预测,AI 推理则更容易被应用流量带着走。

  一个新产品爆了,模型调用量可能很快冲上去,服务器、电力和散热压力也会跟着上来。

  对数据中心来说,问题不只是电够不够用,还有电价怎么管、波动怎么扛、备用电源和储能怎么配。

  举个最简单的例子,很多地方工业电价都有峰谷差,夜里用电便宜,白天高峰时段更贵。

  数据中心如果配储能,就可以在夜里低价充电,白天电价高、负载上来的时候放电,既少买一部分高价电,也给突发流量留出缓冲。

  过去一年,宁德时代通过关联方接触了数据中心和电力设备领域,世纪互联(VNET)是第三方数据中心运营商,中恒电气做 HVDC(高压直流)供电系统,这些都和 AI 数据中心的电力侧有关。

  DeepSeek 这轮融资的投资者名单,本身就是一张产业地图。

  国家 AI 基金代表的是政策支持和长期资本,意味着这是国家战略层面的布局;腾讯代表的是应用层和分发渠道,意味着 DeepSeek 的技术,会快速渗透到消费互联网的各个场景;宁德时代代表的是能源和数据中心底座,意味着国产 AI 基础设施的竞争,已经从算力延伸到了电力。

  这不是一次普通的创业融资,而是在建立一个围绕 DeepSeek 的 AI 基建联盟。

  03 部分 Harness 闭环与需求制造

  去年,DeepSeek、智谱、MiniMax、月之暗面还没有现如今这么大的区别,大家都还只是“小龙”。但是到了今天,这 4 家已经完全不同了

  智谱走的是政企和企业市场路线。

  S&P Global 对智谱的描述是,公司收入主要来自本地部署(on-premise deployments)和云端部署(cloud-based offerings)。

  智谱的 token 可不便宜,它不仅不便宜,它还是“小龙”里面最贵的。不过这并不妨碍智谱增长,如今,智谱的市值已经达到了 5700 亿港元,上市短短四个多月,股价累计涨幅已超过 10 倍。

  智谱的增长是怎么来的?智谱最大的客户群体是企业以及政府,他们要的是能稳定交付、能过合规审查、能在客户自己的机房里跑起来。

  这刚好也是智谱的强项,与此同时,唐杰还表示,目前看好长周期任务,或许在暗示,GLM 的下一阶段特性,就是长周期任务。

  虽然说智谱也开源,但智谱学不来 DeepSeek。

  因为它已经上市,必须证明收入增长。压低 API 价格就意味着降低利润,显然违背了股东意愿。

  MiniMax 跟智谱、DeepSeek 都不一样,它更偏应用和多模态产品。

  在它的收入结构里,海螺、星野、Mavis 这些 AI 原生产品的占比很大。

  MiniMax 2025 年财报显示,AI 原生产品收入从 2024 年的 2180 万美元增至 2025 年的 5310 万美元,总收入增至 7900 万美元。

  所以 MiniMax 的逻辑是尽快把模型能力包装成用户能付费的产品,然后再靠产品去打动客户。

  MiniMax 会学 DeepSeek 的成本效率,因为视频、语音、Agent 都是重算力产品,成本压不下来,商业化就很难跑通。

  然而 MiniMax 和智谱一样,它同样也需要利润,需要用户订阅,以及它非常需要海外收入。

  话说回来,Kimi 才是最接近 DeepSeek 的,不过也没那么接近。

  首先,Kimi 没有上市,和 DeepSeek 一样。

  它既有C端聊天和会员,也有 API,也在开源 Kimi K2.6 这类模型。

  外媒报道称,月之暗面年化经常性收入(ARR)在 4 月超过了 2 亿美元,其增长来自付费订阅和 API 使用。

  在 API 方面,根据 OpenRouter 数据,调用 Kimi K2.5 最多的两个场景,就是 OpenClaw 和 AI 编程软件 Kilo Code,全都是日常办公的入口。

  Kimi 跟 DeepSeek 的区别在于,前者更注重打开次数。

  对 Kimi 来说,C端的产品体验非常重要,因为 Kimi 的强项,比如长文本、代码、Agent,这些都是“直接面向用户”的场景。Kimi 要做的是把模型能力包装成一个用户愿意长期使用的产品入口。

  DeepSeek 的 APP 虽然流量大,但它不是一个超级 APP,它顶多就算是一个只有问答功能的小程序。

  归根结底,智谱、MiniMax、Kimi 都在回答一个问题,用户为什么为我付费。

  DeepSeek 不一样,它要回答产业链为什么围着我适配。

  DeepSeek 的 API、开源模型、以及对国产 AI 芯片的适配,本质上是让自己成为一个“定价标准”。

  企业采购模型会拿它比,开发者选模型会拿它比,芯片和存储厂商做适配也会拿它比。

  一旦 DeepSeek 的生态起点坐实,整个 AI 产业链都得围绕着梁文锋重新定价。

  这也是为什么 DeepSeek 敢在 API 价格上如此卖力,因为这才是 DeepSeek 整个故事里,最容易被人看到的部分。