豆包即将收费:不敢亮价,何谈竞争

  文 | 锦缎

  看了几天,市场上关于豆包收费版这件事,大多解读不幸都是错的。

  总结下来,市场上对于豆包保留免费版本、同时对高级功能开启收费版本的叙事,基本可以分为两类:

  第一类是互联网时代的“免费战胜收费”叙事: 

  在这个叙事中,豆包现在月活全球第二、中国区第一,一旦推出收费版,活跃用户就会迁移到免费模型,DAU 下降,会影响豆包的估值。

  第二类是 SaaS 时代投资人的“收费困难症”痛苦记忆重现: 

  在这个叙事中,中国市场软件付费习惯有限,开启收费模式产生的收入体量非常可疑,杯水车薪,于事无补。

  这两个解读在我看来,毫无意外均属对 AI 发展的误判,也是今天互联网舆论圈对于 AI 发展前沿的判断力,尚未跟上中国 AI 技术能力进化的一种体现。

  在我们看来,以豆包为样本,保留免费基础功能、通过订阅模式走向商业化,是 AI 作为一种提供价值的工具属性的必然回归,更为重要的是,这个过程中无论免费用户还是付费用户,产品最终体验都将获得提升。

  而当下舆论囿于古典互联网时代的流量叙事,或受限于收入体量逻辑的 SaaS 叙事,已经与当下 AI 时代的发展逻辑产生了相当的脱节。

  模型推理有真实成本:一线 AI 大厂的同构妙手

  与互联网和 SaaS“边际成本为零”的逻辑不同,AI 无论是训练还是推理,每天都在产生巨大的真实成本。

  关于字节算力成本的信息有限,我们不妨用有限公开信息做一个粗略年化估算:

  根据媒体和火山引擎官方披露,截至 2026 年 3 月,豆包日均 Token 消耗已达120 万亿,较 2024 年 5 月上线时增长 1000 倍(当时仅 0.12 万亿/天)。这个增速意味着用户对豆包的消耗,远超早期聊天机器人时代,是 Agent、多模态、长链路任务爆发后的结果。

  字节跳动对算力成本的控制已经非常优秀:

  例如在之前的 Pro 版中,字节公布了低至0. 0008 元/千 Token的定价,不难推算字节自建算力的真实成本应该比这个数字更低。但即使以这种显著低的成本来评价,豆包的算力消耗依然惊人:

  以 Pro 版定价估算,豆包每日算力消耗上限在1 亿人民币上下;即使我们假设算力成本仅为定价的 30%,豆包每日算力消耗最低也应在几千万人民币量级。这意味着豆包年化推理硬成本轻松过百亿。

  要知道,这还没有算新模型训练、上游资本开支、算力迭代采购等巨额投入,也没有考虑豆包用户数继续增加、长任务增长后的额外消耗——每一项都直指每年千亿级消耗。

  豆包这样每年百亿人民币起步、且仍在指数级增长的使用成本,与古典互联网时代的“边际成本为零”逻辑天差地别。

  每年动辄百亿直指千亿的长任务算力消耗,意味着任何一家互联网巨头用自己的广告业务对 AI 进行现金流补贴,都几乎不可持续,很快就会碰到现金耗竭的墙而不得不有所取舍:

  要么大幅涨价/限额,要么挖掘专业付费用户生产力服务潜力。

  豆包收费的行动逻辑与 OpenAI 等一线大厂如出一辙

  我们不妨看一下全球其他 AI 大厂是怎么做的:

  2025 年底至 2026 年初,OpenAI 大幅强化 Codex 能力(代码生成 + Agentic Coding 能力),但同时主动限制免费用户的使用,并放缓整体用户增长速度。

  具体做法是:OpenAI 把最强的推理模型(o1、o1-pro、Codex 增强版)深度绑定到 ChatGPT Plus / Pro / Team 付费计划。免费用户虽然还能用基础 GPT-4o,但复杂长任务(多文件重构、长时间 Agent 调试、百万行代码库理解)被大幅限制或排队

  这直接导致 2025 年下半年到 2026 年初,OpenAI 的周活跃用户增长明显放缓——之前每月新增几千万用户,如今增长已逐渐趋稳。但这正是 OpenAI 有意为之的一步棋:优先服务愿意付费的专业开发者和企业,API 与企业订阅收入占比快速上升,财年收入增长主要来自 API 和企业订阅,而非消费者免费用户。

  2026 年初,OpenAI 正式将 Codex 代理功能开放给 ChatGPT Pro、Team 和 Enterprise 用户,并明确表示初期“慷慨访问权限”,随后将实施使用频率限制,免费用户需额外购买积分。

  这正是“强化高消耗能力 + 付费优先 + 免费限流”的典型操作,与豆包当前策略高度同构。

  随着付费增强的 ChatGPT 能力提升,免费用户也会因此受益——这才是正确的商业飞轮。

  我们不难看出,在这个问题上,字节和 OpenAI 面临的情况是同构的。豆包在中国市场的地位与 ChatGPT 等量齐观,用户继续高速增长已不是首要目标,基于定价区分的用户体验优化来的更为重要。

  事实上,AI 组织设定的北极星指标越是靠近“领红包、做月活、强运营”,整个公司的模型能力就距离 AGI 这个圣杯越发遥远,模型会陷入浅层使用和流量优化等非核心指标里无法自拔,始终在与生产力提升无关的问题上反复打转,消耗已经十分昂贵的算力资源和组织耐心。

  AI 是工具,付费用户的体验才是有效反馈源

  今天很多的 AI 舆论所走入的误区是:AI 订阅的本质不是卖功能,而是卖不同强度、不同成本曲线下的 Token 使用权

  生产力工具必然伴随成本,它本质上是通过付费机制筛选出高质量反馈源,从而推动模型向更实用、更可靠的方向进化。

  首先,工具类产品的迭代需要明确的参照系。免费模式虽然能快速积累用户规模,但往往带来大量低质量反馈。这些免费用户多为浅层尝试者,使用场景有限,反馈内容常停留在表面情绪或随机测试层面,容易形成噪声,掩盖真实的核心需求。

  相比之下,付费用户是愿意为性能、响应速度、稳定性、上下文长度等关键指标直接付费的群体。他们的付费行为本身就是一种强信号,表明他们对模型有实际依赖和深度使用意愿。这种反馈更具商业真实性和改进价值,能帮助团队优化方向。

  这一机制在传统软件和 SaaS 领域早已被验证有效。

  比如,Figma 在推出 Professional 和 Organization 付费计划后,付费设计团队(尤其是大型企业用户)的高频复杂协作场景反馈,直接推动了多版本历史、AI 辅助设计(生成变体、自动布局优化)等核心功能的快速迭代。这些功能远超免费用户浅层使用的贡献,最终让 Figma 在设计工具领域形成难以撼动的护城河。

  豆包也是同样的道理:通过设置付费门槛,锁定的是有真实业务场景的企业用户、专业工作者和深度应用者。通过收费,这些生产力场景的用户可以免去算力稀缺产生的排队时长消耗。

  这意味着在资源分配上,系统会优先保障付费用户的请求:响应速度更快、无需排队、复杂任务处理更稳定。付费版往往能调用更高性能或满血版模型,减少幻觉、提升上下文保持能力,同时在多轮对话或重度生产力任务(如 PPT 生成、长文档分析、高清生图)中保持流畅。

  免费版高消耗功能(如高级生成)有每日额度限制,用完即受限或降速;付费版不仅额度大幅提升,还叠加优先权,确保重度用户在需要时“说用就用”。

  更重要的是,在算力稀缺的大背景下,当前全球大模型普遍面临算力卡短缺的现实困境,OpenAI、Anthropic、Google 等一线厂商无一例外都在通过付费分层来缓解这一矛盾:豆包这一设计符合工具类产品的资源分配逻辑。

  对普通用户而言,日常轻度使用免费版完全够用,不会受到明显影响;对职场人士、创作者、学生等有频次需求的用户来说,68 元/月换来“不卡顿、不等待”的效率提升,往往是值得的——它直接转化为时间节省和产出提高。

  通过付费分流高消耗用户后,整体算力资源得到更合理的分配,免费用户的排队等待时间也将明显缓解,形成“付费用户体验升级 + 免费用户体验改善”的双赢局面。这正是工具类产品在资源稀缺环境下的最优资源配置逻辑。

  简单说,工具必然有成本,工具迭代必须有明确参照系。只有付费用户愿意为性能、速度、稳定性买单,他们的意见才具备商业真实性与改进价值。免费用户的大量噪声往往掩盖真正需求,付费行为本身就是最精准的信号筛选机制。

  AI 的终点是 AGI,而不是下一个流量平台或 SaaS

  无论我们有多乐观,但不能否认的是,今天的 AI 仍然处于物种繁荣的早期。穿越通向 AGI 这一最终圣杯的漫漫长路,需要依靠付费用户的深度反馈,真正推动模型向实用工具、向 AGI 进化。

  在这条路上,企业和个人付费的营收以及倍数并非关键。用古典的 SaaS 估值倍数衡量,往往会产生极大的偏差。真正有价值的,是模型在逻辑推理、知识应用、任务执行等方面的进步。而付费用户的真实场景反馈,正是推动这一进步的最可靠输入。

  他们在工作、创作、决策等实际应用中,会充分暴露模型的幻觉问题、上下文保持能力不足、领域知识短板等缺陷。这些反馈能直接转化为迭代优先级,帮助模型从通用聊天工具逐步向可信赖的生产力助手转型。

  收入增长在这一过程中,也成为衡量生产力水平的重要标准。付费用户规模扩大,意味着模型为用户创造的边际价值被市场认可,中国 AI 公司因此获得可持续的现金流,用于进一步加大研发投入、算力采购和数据优化,形成正向循环。

  反之,如果完全依赖免费模式,虽然短期流量可观,但容易导致资源分散和反馈失真,拖累长期技术进步。

  今天炙手可热,估值接近一万亿美金的 Anthropic 在付费分层问题上走的更早,走得更远:

  2026 年初,Anthropic 将高消耗的 Claude Code 功能逐步从基础 Pro 计划移除或限额,推动重度用户升级至更高档位或转向 API 付费。

  这直接帮助 Anthropic 推理毛利率从 38% 提升至 70% 以上:Claude Code 周活用户两个月内翻倍,ARR(年化收入)快速攀升至数百亿美元级别。

  付费用户的高强度反馈,正是推动其 Agentic Coding 能力持续领先的核心动力。

  豆包的收费策略,正是对长期主义的一种体现:不被流量焦虑主导,而是通过价值交换来积累高质量信号,推动 AGI 相关能力的稳步提升。

  事实上,更多的中国大模型公司,都应该积极推动用户基于模型能力付费,来用更优秀的生意模式,对模型优化产生正反馈。

  诛心而论,没有信心收费,反而才可能是组织内核不稳的显性表现。

  结语

  在我看来,豆包此次收费不是太早,甚至可以说姗姗来迟。

  它体现了豆包作为中国大模型先发者应有的觉悟:不沉迷免费流量和用户数量的一时一地的领先,而是主动建立可循环、健康的商业闭环。

  这一步不仅是为自身造血,更是为行业树立正确标杆——AI 的未来,属于那些敢于向价值付费者负责的模型,这是通向 AGI 的必经之路。