梁文锋想送DeepSeek一个成人礼

  文 | 硅基研究室,作者 | kiki

  DeepSeek 正在告别过去那个低调的自己。

  MiniMax 创始人闫俊杰曾讲过一个关于 DeepSeek 创始人梁文锋的故事。他说有一次约梁文锋吃饭,当时双方并未见过面。闫俊杰到早了看到一位穿T恤的小哥,对方和他聊了半小时的技术,直到闫俊杰开口问:“梁总什么时候来?”

  这个他心目中是助理的T恤小哥,回了一句:“我就是梁文锋”。

  这个故事里,闫俊杰认为梁文锋是一个低调专注的人,这和过去 DeepSeek 对外展现的形象一致:不融资、不 pr,保持自身的独立性。在大厂、MiniMax 等模型创业公司的两股力量外,DeepSeek 走出一条特立独行的路。

  极客公园创始人张鹏形容此类公司的特点:“较高的利润率、可观的利润规模、有砸几十亿美元的投入决心,以及创始人自己对大模型领域足够深的投入,在技术决心和业务决定上的极度笃定。”

  但现在,DeepSeek 似乎变了。

  从被曝出推进 700 亿人民币的融资,到公开组建 Code Harness 团队,再到一向神秘的 DeepSeek 研究员们也开始在小红书活跃......最新的动作是,DeepSeek 官宣其原定于 5 月底结束的 DeepSeek-V4-Pro 模型 API 价格的折扣永久化。

  从模型降价的老招式,到一改往日低调的高调融资、招兵买马,梁文锋真正想做的,是送给 DeepSeek 一个真正的成人礼。

  1、一改低调的 DeepSeek

  DeepSeek 正在变得越来越高调。

  自 4 月 DeepSeek-V4 发布、传出融资需求后,「硅基研究室」观察到,DeepSeek 正在产品应用、模型能力以及人才组建上多箭齐发。

  首先是,产品应用侧全力瞄准 Agent。

  DeepSeek 正在北京组建 Code Harness 团队,据 DeepSeek 研究员陈德里的描述,DeepSeek 的 Agent 业务目前主要聚焦 AI Coding 方向,旨在打造 DeepSeek 桌面端 Agent 产品。“或许你可以把它叫做 DeepSeek Code 或者其他什么名字”。

  短期将 Agent 的主战场定位 Coding 领域,而非通用型 Agent,这并非是 DeepSeek 的特立独行,而是当下大模型公司的共识。

  一方面,Coding 是模型心智和模型能力的加速器。

  OpenAI 借 Codex 的密集更新,迎来口碑翻转。另一边的 Anthropic 则是因为较早押注 Coding 方向, 凭借 Claude Opus 系列编程模型和编程应用 Claude Code 反超 OpenAI。

  Coding 场景也能给模型的能力带来先发优势。内生的思维链让模型可自发完成推理与思考过程,Coding 自身可验证性强,用户数据可以反哺模型训练,实现能力提升。

  据东方证券数据,Anthropic 在今年 2 月至 3 月底,一个多月内迭代了 30 多项 Harness 层功能,因此更早拿到正向反馈,同时借其他 AI Coding 产品作为分发渠道,自身 Claude Opus 系列模型深度集成进 IDE,作为分发渠道,使 Anthropic 积累到大量数据,来用于模型能力提升。

  另一方面,Coding 能更好地卖 Token。

  国内阿里、腾讯、字节等大厂,也聚焦基模的 Coding 能力和独立的 Coding 工具建立自身的 Token 经济闭环。

  阿里云公共云事业部总裁刘伟光此前就谈到:“Coding 产生 Agent,Agent 产生 AI 应用,Agent 又回到云上消耗算力。”这构成了做大 Token 经济从「token-云-应用」的循环。

  海外的大模型公司已经看到了 Coding 带来的收入曲线。据 Anthropic 今年 2 月的融资公告,Claude Code 年化收入已超 25 亿美元,较 2026 年 1 月翻了一倍多。

  其次,在模型能力上,用成本优势换模型能力升级的时间窗口。

  SemiAnalysis 的研究曾指出,DeepSeek 的技术迭代不仅关注智能水平,而是致力于极大提升「每单位 Token 的成本效率」,这也是其为什么被称为「价格屠夫」的原因所在。

  DeepSeek 最新的动作是官宣其原定于 5 月底结束的 DeepSeek-V4-Pro 模型 API 价格的折扣永久化。

  按百万 tokens 算,Pro 的缓存命中输入是 0.025 元,缓存未命中输入是 3 元,输出是 6 元,原来的价格分别为 0.1 元、12 元、24 元,在国内模型普遍涨价的背景下,梁文锋再度给了友商重击。

  X 上的一位用户这样评价:“当你整天使用 DeepSeek ,花费仅相当于一包薯片的价格时,你才会意识到它有多便宜。”

  一位大模型行业人士告诉「硅基研究室」,DeepSeek 此举是在用成本为自身 Coding Agent 建生态。“这个动作主要会对国内模型厂商产生影响,因为大家模型性能的代际差距并不大,GLM、kimi 的编程能力不错,MiniMax 强在多模态,一旦 DeepSeek 用‘最佳价格’,再加速模型迭代,各家间的差距会迅速缩短。”

  最后,则是招兵买马。

  包括郭达雅等多位研究员离职后,DeepSeek 开始快速招兵买马。以 Harness 团队为例,DeepSeek 引入了「量化交易老兵」、TSY Capital 联合创始人崔添翼。DeepSeek 研究员陈德里近期也在小红书上高频活跃,在社交媒体上发起「英雄帖」。

  有大模型猎头告诉「硅基研究室」:“今年 DeepSeek 的 hc 确实在变多,但要求和门槛并不低。”

  「硅基研究室」还观察到,除 Agent 岗位外,DeepSeek 在招聘中释放出测试开发工程师、预/后训练研究员、模型策略产品经理等多个岗位,甚至还招起了 HR、企业文化主管等非技术岗位,这都意味着,DeepSeek 正朝着一个更大的组织扩张。

  2、梁文锋给 DeepSeek 的价格建模

  梁文锋曾给 DeepSeek 立下规矩:不接受外部融资、不稀释股权、不被任何人的商业化时间表绑架。

  「三不」源自 DeepSeek 的特立独行——

  背靠幻方量化输血,极致的成本控制,所以不缺钱;没有二把手,相对小且扁平独立的研究性团队,所以不会愿意稀释股权;梁文锋本人以 AGI 为追求,专注极致的策略,所以不会被任何人的商业化时间表绑架。

  但为什么在当下,梁文锋会一改往日低调态度?原因是,大模型竞争已走过了青春期。

  智谱和 MiniMax 已经上市,kimi 和阶跃星辰也从未停止 IPO 计划,今天的大模型竞争也已不再是单一的模型能力竞争,而是人才、产品、生态等系统化能力的比拼。

  强模型依然是核心武器,前者 DeepSeek 固然可以通过小而美的组织形态和极致来实现,梁文锋可以力出一孔不畏外界的噪音,但后者,却是他最难以控制的地方,人才、产品、生态以及商业化,它难以只通过模型这一张牌去获得。

  当其他独角兽都走过了成人礼,梁文锋也意识到,是时候给 DeepSeek 一个成人礼了。

  首先,要重新给 DeepSeek 找一个心智定位。「最强模型」「价格屠夫」都是过去时,DeepSeek 通过开放融资,吸引外部资本,是在强化自己的一个新战略定位:

  国产 AI 基础设施中的核心节点。

  DeepSeek 被传的潜在投资方里,同时多方身影:包括国家大基金、宁德时代、京东、腾讯、Monolith 等,一位 AI 投资人告诉「硅基研究室」:“投资 DeepSeek 战略价值高于实际财务回报”。

  他口中的战略价值源自两个方面:一是 DeepSeek 的开源路线带动了早期国产 AI 生态链的形成:包括 AI Infra 公司硅基流动、无问芯穹、清程极智等,应用层的端侧手机厂商以及一批B、C端 AI 应用。

  二是 DeepSeek 是适配国产算力最坚决、最积极的。晚点曾提到,除了追求大模型的智能上限外,梁文锋认为很重要的一项工作就是基于国产生态来做大模型。

  DeepSeek 在 V3.1 的技术报告里曾提到采用的 UE8M0 FP8「是针对下一代国产芯片设计」,在 V4 技术报告里,DeepSeek 在华为昇腾芯片上验证了细粒度并行 EP 方案的技术可行性。

  V4 发布当天,8 家国产 AI 芯片都宣布与 V4 完成适配,这说明,DeepSeek 在原生支持国产芯片如重写算子等方面花了较大的精力和时间。

  同时 DeepSeek 对国产算力的工程化适配本身也契合国产芯片异构协同的技术方向。

  不难发现,DeepSeek 的角色已发生变化,从纯模型公司转化为国产 AI 基础设施中的核心节点。

  其次,要重新给 DeepSeek 找个「超级入口」。

  在《DeepSeek“朋友圈”的B面:抢入口、争流量,开打算力战》一文中,资深芯片专家、中存算董事长陈巍曾告诉「硅基研究室」,DeepSeek 所带来的改变是,让更多人知道了:“大模型也可以成为一个超越互联网、甚至超越原先这些操作系统的超级流量入口。”

  但一年过去,超级流量入口的竞争已上升为超级入口的竞争。

  阿里的千问、字节的豆包都在尝试进化为新的超级入口,这些 AI 应用的相似野心是,试图用一个入口包揽用户所有的使用场景。

  今年 618 前夕,阿里宣布千问和淘宝完成深度整合,豆包也开始尝试付费分级,它们在超级入口的探索中都不可避免地遇到挑战。

  DeepSeek 和它们都不一样,它既没有字节的 APP 工厂,也没有阿里的多板块协同,它的C端入口当前只有一个,而且为 chatbot。

  因此梁文锋必须重造一个超级入口,它瞄准的也是 Agent。从目前披露的信息看,DeepSeek 应该会双管齐下:

  第一,C端原有的入口会注重多模态能力和情感陪伴能力的升级。

  此前 DeepSeek 灰测识图功能,预告了多模态能力的进展。

  「硅基研究室」还了解到 DeepSeek-V4 强化了角色扮演能力,官方还上线了角色扮演的特殊控制指令说明,用于在思考模式下切换思维链风格。

  5 月,DeepSeek 研究员陈德里在社交媒体上公开对角色扮演能力和情感陪伴能力进行了用户调研。

  第二,聚焦 Coding Agent,也就是 DeepSeek 组建的 Agent Harness 团队,可能会推出一款桌面级 Coding Agent 产品。

  在招聘中,他们要求候选人深度使用 Claude Code、Cowork、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes 等产品。

  最后,则是给 DeepSeek 的人才组织找一个新的市场定价。

  不可否认的是,今天 DeepSeek 研究员已成为巨头争抢的对象,梁文锋不可避免地也需要回答,今天的大模型世界里,DeepSeek 到底值多少钱?员工手中的期权价值几何?

  除此以外,在 token 成为新的薪酬标配下,和大厂相比,DeepSeek 的算力却是相对有限,梁文锋也必须要有更多的算力和未来的想象力,来留住人心。

  心智定位、超级入口和人才定价,这些都在倒逼梁文锋改变了想法。

  梁文锋曾说:“每当在工作中遇到困难的时候,我会想起量化之王的话:‘一定有办法对价格建模。’”他口中的西蒙是“量化之王”。

  现在,到了市场对 DeepSeek 定价的时刻,梁文锋依旧是那个主导价格建模的人,这一点,依然未变。