OpenAI的新挑战:九大产品繁杂难以管理,让用户眼花缭乱

  智东西

  编译吴浪娜

  编辑漠影

  智东西 9 月 29 日消息,据 Supervised 今天报道,虽然 OpenAI 的最新模型 o1 在性能上有了显著提升,但它也给该公司带来了一个潜在的新挑战:产品组合繁杂。

  OpenAI 的最新产品 o1 和 o1-mini,实际上让用户和客户在性能和成本之间做出了权衡:你可以选择等待更长时间,并暂时支付更多费用,但输出结果应该会好得多。它不是那种可以插入呼叫中心的应用程序接口(API),但它确实为这家已经覆盖了一系列细分市场(除了没有“一个几乎无所不能的产品”)的公司填补了一种新的细分市场。

  o1 的应用场景基本上是“你需要稍微思考一下”的问题。美国云服务管理平台 Box CEO 亚伦·列维(Aaron Levie)给出了一个极好的企业应用场景,即需要找到合同中一个非常具体的参数——例如,合同的最终签署日期,也就是合同实际生效的日期。这是一个真正“需要稍微思考一下”的问题,在一个原本简单的问题上增加了一层复杂性,人们可能在不同的日子签署了合同。

  这对于 OpenAI 来说也是一种相对较新的应用场景。在过去,OpenAI 可能需要调用一系列很长的 API,并请求模型以提示调整或检索增强生成(RAG)的形式完成所需任务。相反,整个过程可能会被压缩成一两次调用,从而简化某些架构。OpenAI 已经经历了一种“SaaS 化”的过程,在这一过程中,OpenAI 逐渐成熟,成为一家真正的企业。

  随着 OpenAI 逐渐发展成为一个真正的企业,其产品组合(或称为模型组合)日益复杂,OpenAI 正面临着公司产品组合繁杂的挑战。产品组合越庞大,管理难度就越大,处于这一阶段的公司面临的最大挑战就是如何避免产品组合变得繁杂,难以向用户传达价值。而且随着模型质量的不断提高,任何微小的分心都可能导致 OpenAI 被其他前沿模型公司超越。

  Supervised 总结了 OpenAI 现在非常庞大的 API 组合,共有 9 个产品:

  1、GPT-4o:一个多模态、昂贵(虽然也没能幸免于降价影响)的模型,应该是通用型的好产品。

  2、GPT-4o mini:GPT-4o 的削弱版本,旨在作为其主力模型 GPT-3.5 Turbo 的继任者,以满足大量更简单的应用场景。

  上述模型的微调版本,可满足企业的特定需求,尽管它们通过 API 提供,这可能会让一些更注重安全性的公司望而却步。

  3、o1:一个以速度和价格为代价换取质量的模型,允许它有更多时间对答案进行“推理”。基本上就是需要“停下来想一想”的问题。

  4、o1-mini:就像 4o mini 一样,是 o1 的削弱版本,设计用于……同样的“停下来想一想”的问题,但我们可以假设它确实能解决一系列问题。

  5、Whisper:可以说是市场上最好的语音转文本模型,可以肯定的是,它是为生成 OpenAI 所需的训练数据而构建的。

  6、文本嵌入:算不上最好的嵌入产品,但其优势通常在于它与其他 OpenAI 产品一起提供,从而减少了采购的麻烦。

  7、文本转语音:假设延迟正常,你可以将其应用到类似呼叫中心里的 API。它有普通和高清两个版本的 API。

  8、高级语音助手:一个技术奇迹般的产品,它可以让你在 ChatGPT 内进行主动对话,尽管其应用场景仍然不太明确。

  9、ChatGPT:OpenAI 将上述所有内容“产品化”,集合到一个前端企业友好型的包装中。

  在此期间,Meta 开始显示出更多的混乱,它在几乎每一个类别中都发布了更新的模型。不过 Meta 这些模型是开源的,并为一系列非常不同的产品提供支持,尽管它们存在于同一个“桶”中。通过 o1,OpenAI 本质上是在再次尝试创建新的类别,但同时也冒着产品组合繁杂的风险。

  下面对比了 OpenAI 和其竞争对手的产品定价:

  ▲OpenAl 的产品在价格和用途上存在差异(图源:X)

  这些费用可能远未达到 o1 发布一段时间后的水平。OpenAI 已经开始逐步增加速率限制,最近 o1-preview 从每周 30 个增加到 50 个,o1-mini 从每周 50 个增加到每天 50 个。

  ▲OpenAI 在社交平台X上分享道,将逐步增加 o1-preview 和 o1-mini 的速率限制(图源:Supervised)

  虽然 OpenAI 的吸引力一直在于便利、价格和性能之间的某个最佳平衡点,但其繁杂的产品组合无疑既是挑战也是机遇。该文章作者马修·林利(Matthew Lynley)严重怀疑价格不会一直这么高,因为其下一个 GPT 模型迟早会准备好。但就目前而言,它至少在试图筹集巨额资金的时候,开发者拥有了一些价格较高的产品当作谈判筹码。

  然而,这里的挑战与任何成熟企业随时间推移开始面临的挑战相同:产品繁杂。虽然 OpenAI 在技术上以 API 和 ChatGPT 的形式拥有“两个”产品,但这些产品都有大量的分支,服务于非常广泛的应用场景。这些 API 也远远超出了聊天补全和文本生成的范围,包括了各种各样的模态。而它的语音产品看似是 ChatGPT“惊艳”的部分,其实可能是其产品组合中最尴尬的部分。

  产品繁杂在创业领域是一个公认的问题,如果你还能称 OpenAI 为一家初创公司的话。随着初创公司的成熟,其用户和客户群的不断扩大,它必须有方向性地发展,更少的产品满足更多客户的需求,而不是为每个人构建一切。或者更简洁地说,做几件事,但都要做好。

  提供如此广泛的应用场景,让 OpenAI 能够将用户引导到某种稳定状态,在这种状态下,它不一定赚钱,但至少不会亏本。在 API 方面,传统的做法是将用户推向其主力模型(特别是微调版本),但对于 ChatGPT 而言,这一点就不太清楚了。

  虽然新模型在 ChatGPT 中是有速率限制的,但这也是 OpenAI 除了 API 之外极其重要的业务部分。据 The Information 报道,OpenAI COO 布拉德·莱特卡普(Brad Lightcap)告诉员工,OpenAI 拥有超过 1000 万名 ChatGPT 的付费订阅用户,另外还有 100 万名企业订阅用户。(彭博社此前曾报道,OpenAI 有 100 万名 ChatGPT 的企业订阅用户。)

  当然,我们可以做很多粗略的计算,但都会得出相同的结论:除了 API 之外,ChatGPT 的企业业务现在和将来都会是 OpenAI 业务的重要组成部分。

  但 ChatGPT 带来的收入并不会像 API 那样,直接随着 o1 的使用而增长。无论是通过 API 还是 ChatGPT 内部运行 o1,实际运行它的成本可能会随着预训练计算资源转向推理而发生变化。

  幸运的是,OpenAI 在这一领域已经有了很多进展。业内人士目前额外关注的一种方法是蒙特卡洛树搜索(Monte Carlo Tree Search),它可以减少生成高质量结果所需的计算量。蒸馏(distillation)是另一种“缩小”大模型的方法,随着人们的兴趣转向管理高性能模型的推理成本,蒸馏法也获得了很大的发展。 (蒸馏是一种机器学习模型压缩方法,它用于将大型模型的知识迁移到较小的模型中。)

  “这就是甜点,将传统预测性机器学习的策略与现代技术相结合。”模型开发商和平台 h2o 的联合创始人兼 CEO 斯里·安巴蒂(Sri Ambati)告诉马修,“树状搜索是一个绝对的天才技巧,它是一种非常容易实现的目标,与大语言模型的卓越性相结合。”

  在与专家和知情人士交谈的交谈中,最常提到的另一点是诺姆·布朗(Noam Brown)在 OpenAI 的工作。布朗被广泛认为是博弈论领域的顶尖专家,许多人都想知道他的工作将如何应用到 OpenAI 的产品中。布朗还是一篇论文的共同作者,该论文部分研究了蒙特卡洛树搜索在开发类人代理中的应用。

  结语:OpenAI 面临成本挑战,降价保竞争力

  OpenAI 的 API 面临的挑战是,根据最近与大多数企业和平台的情况,在为场景构建 AI 应用时,成本是第一或第二重要的考虑因素。但 OpenAI 已经表现出逐渐降低价格以保持竞争力的意愿。

  此外,ChatGPT 的企业业务似乎是 OpenAI 业务的主要驱动力,这也很说明问题,因为所有这些开发基本上都是为该企业套件服务的。对于那些在管理和成本方面有更高要求的公司来说,使用现成的廉价产品在公司内部开发定制产品的做法越来越有吸引力。

  有一种愤世嫉俗的观点认为,OpenAI 试图说:“嘿,看,我们还在创造非常先进的东西,别忽视我们的融资号召。”

  然而,这种观点的另一面是,根据 CNBC 的报道,OpenAI 似乎已经获得了一轮超额认购的巨额融资,已经成长为一家更适合企业产品的公司。现在,OpenAI 只需要确保其在销售电话中不会用庞大的产品组合迷惑企业。

  来源:Supervised