字节、阿里再掀价格战,百度紧跟!大模型卖出“白菜价”图什么?

  大模型价格战打得几近疯狂。

  5 月 21 日上午,阿里云宣布通义千问 GPT-4 级主力模型 Qwen-Long 降价 97%,1 块钱可以买 200 万 tokens。

  这一举动颇有些剑指字节的味道。此前,字节跳动 5 月 15 日发布豆包大模型,宣布其主力模型市场定价为 0.0008 元/千 tokens,较行业平均价格便宜 99.3%。阿里云降价后,其 API 输入价格从 0.02 元/千 tokens(文本单位)降到了 0.0005 元/千 tokens。

  但尽管降价 97%,阿里云的价格优势也仅维持了几个小时。21 日下午,百度智能云便宣布文心大模型两大主力模型全面免费,立即生效,包括 ERNIE Speed 和 ERNIE Lite。

  “只要有一家降价都得跟,要不然估计就会掉队。”针对大模型厂商近期降价,新浪微博新技术研发负责人张俊林对第一财经记者表示。激昂又惨烈的价格战背后,大模型厂商有许多不得不跟的理由。

  大模型掀起降价潮

  事实上,这一轮大模型降价潮从 5 月起就初露端倪。

  5 月 6 日,幻方量化旗下 DeepSeek(深度求索)发布第二代 MoE(专家模型)DeepSeek-V2,API(接口)定价每百万 tokens 输入 1 元、输出 2 元(32K 上下文),价格为 GPT-4-Turbo 的近百分之一。

  5 月 13 日,智谱大模型开放平台上线新的价格体系,入门级产品 GLM-3 Turbo 模型调用价格下调 80%,为 1 元/百万 tokens。随后,OpenAI 推出 GPT-4o,价格为 GPT-4 Turbo 的一半,输入、输出每百万 tokens 收费 5 美元、15 美元。字节豆包大模型随之加入降价潮。

  而随着阿里云 4 款通义千问商业化模型和 3 款通义千问开源模型的不同程度降价以及文心大模型两大主力模型的全面免费,大模型厂商似乎正在“榨干”自己的利润空间。

  为什么大模型能有如此幅度的降价?对此,阿里云方面表示,这主要因为公共云的技术红利和规模效应带来的成本和性能优势。通过模型和 AI 基础设施两个层面的不断优化。

  Canalys 云分析师章一则对第一财经记者表示,中国客户群体其实对价格特别敏感,大模型厂商的降价,更多是为了吸引更多客户使用大模型。同时,许多降价的大模型厂商也是云厂商,云厂商让大模型降价最本质的目的还是拉动云消费。

  在不断击穿底价甚至免费的“激进”策略下,大模型厂商“抢阵地”的决心远超其对短期利润的渴望。章一分析,中国厂商本身做生意比较擅长采用的手段是低价打入市场,再通过走量的形式把成本铺开。目前,中国B端市场实际使用 AI 的客户比并不高,通过降价,大模型厂商希望降低使用其大模型的门槛。

  5 月 21 日,针对阿里云宣布通义千问 GPT-4 级主力模型降价,字节跳动火山引擎相关负责人向第一财经记者回应称,非常欢迎通义千问大模型降价,共同助力企业以更低成本探索 AI 转型,加速大模型应用场景落地。

  光降价并不够

  大模型的降价背后,值得关注的是,其背后算力成本的下行也是行业趋势。

  阿里云表示, 弹性的 AI 算力调度系统,并结合百炼分布式推理加速引擎,阿里云优化了大规模推理集群,大幅压缩了模型推理成本并加快推理速度。

  腾讯云近日也提及大模型算力成本下降情况。 腾讯集团副总裁蒋杰透露, 针对低端卡算力低、显存小的不足, 腾讯使用自研 Angel 训练推理平台,调度异构卡集群 ,万亿大模型推理成本比开源减少 70%。

  火山引擎总裁谭待此前表示,字节通过优化模型结构、将单机推理改为分布式推理、混合调度云计算算力等降低成本。 DeepSeek 相关负责人则在知乎上解释 ,DeepSeek-V2 兼顾成本和效果基本靠的都是模型结构创新 。

  但降价之外,大模型领域还需要更多新故事。

  阿里云智能集团资深副总裁、公共云事业部总裁刘伟光在今天提起大模型降价的行业趋势时表示,价格战要遵循市场的基本原则,降价一定要普惠于市场,以推动市场的发展为目标,“不以流量博噱头”。

  什么样的企业可以用降价普惠市场、推动市场发展?刘伟光提到了四个原则:首先,要普惠市场,模型的的基模能力要足够领先;其次,要看模型有没有真正的推理资源;其三,当下的模型是不是有很多客户在使用,能够产生商业价值;最后,大模型是不是这家公司主要的业务,企业有没有战略定力。

  针对如何看待大模型价格战、腾讯是否会降价的问题,腾讯云副总裁、腾讯云智能负责人吴运生近日在采访中则未直接回应。“我们这几天也关注到业界的相应情况。其实我们是把大量精力投入到底层大模型能力提高、让用户真正用起来之中。”吴运生向第一财经等媒体表示。

  “最后一公里”的问题仍横在大模型面前。”章一分析,大模型降价潮可能在短期内吸引一部分客户,但长期来看,要吸引更多用户,大模型仍面临着如何产生更多落地价值的问题。

  大模型究竟能给客户的实际业务带来什么价值?AI 的生产力能否让客户在实际过程中降低成本、提升企业的效率和实际效益,这才是对客户来说另一个层面上的省钱,也是大模型商业化落地进程中的重要问题。无论是国内还是国外,大模型落地产生价值的故事仍不够完整。

  (第一财经记者吕倩对此文亦有贡献)