国思软件 - ChatGPT负责人深度复盘，爆4o复活内幕！过快下线是失误，将迭代模型人格

　　新智元报道

　　编辑：元宇

　　GPT-5 上线引发全网吐槽。8 月 14 日，ChatGPT 负责人 Nick Turley 深度复盘了 GPT-5 发布「风波」，并详细总结了此次产品发布中的失误：比如过快下线 GPT-4o、低估用户会对模型的情感依恋、没有让用户建立起「可预期性」等。Nick 也分享了 OpenAI 的产品设计哲学，要坚持「真正对用户有帮助」的原则。

　　「还我 GPT-4o！」

　　GPT-5 发布后不到一周，在用户强大的反对声浪中，OpenAI 不得不火速宣布 GPT-4o 等前代模型回归。

　　至此，大家才意识到：用户对 4o 等上一代模型，已经产生了深深的「依恋感」。

　　下线 4o，已经不再是产品升级那么简单了，更像是忽然从用户身边带走了一位熟人或伙伴。

　　尤其是对于深度用户来说，这一点更为明显。他们很多都是 4o 等前代模型的忠实拥趸，反弹情绪也更为强烈。

　　这一点令 Altman，以及一直领导 ChatGPT 开发的 Nick Turle 都始料未及。

　　于是，便有了 GPT-4o 的火速回归。

　　事实上，GPT-5 的发布会，给了 OpenAI 一个很好的反思产品的机会。

　　一周之后，Nick Turley 在《The Verge》编辑 Alex Heath 的采访中，深度复盘了 GPT-5 发布后面临的用户差评风波，以及他的一些思考。

　　对谈中，Nick详细总结了 GPT-5 发布的一些失误，比如：

　　过快下线 GPT-4o、低估用户会对模型的情感依恋、用一个模型适用所有用户、没有让用户建立起「可预期性」等。

　　Nick 表示，OpenAI 已经认识到持续迭代模型人格的重要性，并提到通过一个 Model Behavior 的团队来推动这项工作。

　　同时，Nick也分享了 OpenAI 的产品设计哲学，是帮用户解决长期问题、达成长期目标，而不是让用户尽可能留在产品里。

　　「真正对用户有帮助」，才是其设计产品的核心原则。

　　忽视用户情感

　　让 GPT-5 发布后迎意外暴击

　　忽视用户的「依恋感」，让 GPT-5 在发布不到一周后，便被网友锤爆了。

　　用Nick的话说，「很多意外都是写进常态的」。

　　但也没办法，ChatGPT 现在有 7 亿周活用户：用户太多，千人千面，众口难调。

　　这搞得Nick着实头大，几天后他在接受《The Verge》采访时，仍在「消化」这次发布会所带来的影响。

　　他先是总结了 GPT-5 发布的两点失误：

　　Nick：第一，GPT-4o 下线走得太快了，至少在过渡期没有继续提供 GPT-4o；第二，低估了用户会对一个模型有如此强的情感依恋。真正的挑战，不在于产品本身的升级，而是人们对模型「人格」的强烈感受。

　　这两点失误，让Nick认为应当更认真地思考，如何在如此庞大的用户基础上进行产品升级和管理。

　　Nick 表示，OpenAI 已快速修正了这两点错误。

　　一是将原有模型重新提供给 ChatGPT 付费用户；二是对 GPT-5 的个性进行更新，上线了「选择你自己的性格」的能力。

　　8 月 13 日，Altman 发布了 ChatGPT 的更新信息，已经将 4o 恢复为所有付费用户的默认模型，他们可以在网页设置中切换 o3、4.1、GPT-5 Thinking mini 等其他模型。

　　Altman 称在过去几天学到的一点，是真正认识到：要打造一个能够根据用户需求定制更多模型个性的世界——解决方案，就是要让更多用户能够自由定制 ChatGPT 的风格。

　　Nick 提到了一个原则，要努力去理解 4o 身上的一些原本没有被足够认识或重视的东西，比如模型人格对用户的情感价值。在这方面，GPT-5 也要向 4o 看齐，变得更温暖和友好一些。

　　实际上，Sam Altman 已经在 GPT-5 发布后表示，在过去大约一年，OpenAI 就一直在密切关注用户对 GPT-4o 的「依恋感」，但并没有太主流的关注。

　　这次发布会风波，引发了 OpenAI 对 ChatGPT 产品「模型人格」的重视，这也是一个很好的优化契机。

　　放弃模型选择

　　用一个模型适用所有用户

　　放弃模型选择，试图用一个模型搞定所有用户，是 OpenAI 在 GPT-5 发布上的另一个失误。

　　这导致了 OpenAI 在发布 GPT-5 时，没有做分阶段发布。

　　Alex：这个决定背后的动机是什么？是成本因素吗？

　　Nick：这绝对不是成本问题，而是为了追求简单，这也是 ChatGPT 做产品一贯的核心原则。

　　在 Nick 看来，让用户自己去搞清楚「用哪个模型回答哪个问题」，认知负担非常重。

　　而且在用户调查中，Nick 也反复从用户那里听到：他们希望得到的是一个「产品」，不是一堆「模型」。如果 OpenAI 能根据问题，为他们做出合适的选择，他们会很喜欢。

　　Nick 一直认为，大多数用户需要的是像 macOS 这样的产品：

　　既能面向大部人做到简单易用；同时，对于深度用户，他们也可以进设置、打开终端、把各种开关和参数都调起来。

　　同样，Nick 也希望将 ChatGPT 做成 macOS 式的产品：

　　Nick：对于普通用户简单易用，重度用户也能按自己喜好配置一切——包括选择自己最喜欢的模型。

　　因此，面对重度用户，ChatGPT 一直是坚持要保留所有旧模型的。

　　但这次的失误之处在于：他们在 7 亿用户基础之上，对重度用户的分布产生了误判，低估了在其他一些套餐中也存在很多重度用户——正是这些重度用户对旧模型的「依恋感」，让他们在网上掀起了反对声浪。

　　没有让用户建立起「可预期性」

　　凡是成功的产品，都有一个成功的「预期管理」。

　　符合或者超越用户预期，必会赢得用户追捧；违背或忽视用户预期，势必令用户唾弃。

　　GPT-4o 的过早下线，就是踩到了违背「用户预期」的红线。

　　随着 GPT-5，以及未来 GPT-6 等一系列新模型的发布，旧模型何时「退休」也被提上日程。

　　Alex：OpenAI 对此是否有已经有了明确安排？

　　Nick 表示，这点十分必要，而且 OpenAI 也在着手做这件事。但必须坚持一个重要原则：给用户一定的「可预期性」，尤其是在目前用户基数的前提下，这样做尤其重要。

　　Nick：关于用户的「可预期性」，在企业版里 OpenAI 已经这么做了。目前的做法，更像是将这一原则进一步拓展。

　　这也是此次发布会，OpenAI 获得的一个非常明确的经验教训。

　　谈到 4o 的「退休时间」，Nick 表示，目前并没有一个具体的时间表。

　　Nick:我们想先真正搞清楚 4o 擅长的地方。如果没有非要让它下线的重大理由，我很乐意把它保留下来。

　　为了保持用户的「可预期性」，Nick 称，未来 4o 真的要下线，一定会提前沟通。

　　所以，具体怎么做，取决于我们学到了什么。

　　Nick：我觉得这件事需要多去倾听，这也是做 AI 非常独特的一点：你在发布之后会学到海量信息。基于这些，我们会拿出正确的方案。

　　模型人格与「优化哲学」

　　与其猜测 4o 何时下线，更让 Nick 感兴趣的问题是：

　　到底大家是喜欢 4o 本身，还是喜欢 4o 身上的某些具体特质？

　　比如，假设用户喜欢它「人格更有温度」，OpenAI 也会把这个特质带到 GPT-5 上。

　　Nick 称，OpenAI 已经认识到持续迭代模型人格的重要性，并通过一个叫「Model Behavior」的团队来推动这项工作。

　　此外，还会通过 Model Spec（模型行为规范文档），来帮助开发者和研究人员理解和审视模型行为，明确某些行为是设计上的有意为之，还是潜在的 bug。

　　Nick：在未来几周甚至几个月内，还将持续迭代 GPT-5 的「感觉」和「行为」。这次 GPT-5 的发布，也为继续做这件事提供了一个好时机。

　　Alex Heath 提到了这次 4o 下线后，用户在 Reddit 上的惊人反应：

　　「有人说，我一夜之间失去了朋友。这是我唯一的朋友；感觉像有人去世了；我不敢跟 GPT-5 说话，因为感觉像是在「出轨」；我感觉丢了那个很有同理心的同事……」

　　Alex：用户的反应为 OpenAI 带来了什么影响？为什么之前没有充分意识到，大家会有这么强烈的情感依恋？

　　Nick 回答说，其实 OpenAI 内部已经关注这类现象有一段时间了。与此同时，他们也一直在担心：出现一个人们过度依赖 AI 的世界。

　　但让 Nick 没想到的是，人们会对某个「特定模型」产生这么强的感情——而不是对整个产品。

　　Nick：实际上，GPT-5 已经解决了很多大家对 4o 的建设性反馈，甚至在整体氛围上也做了改进。但很多网友对此并不认账。

　　Reddit 上的评论，让 Nick 觉得很有意思，它们显示出用户群体的极度「分化」：

　　Nick：有人特别爱 4o，也有人强烈认为 GPT-5 更好，大家对自己选择的「热情程度」非常惊人。

　　用户的反馈，对 Nick 也有点「重新校准」的意味。

　　Nick 提到，他在一两周前，曾写过一篇博客，在里面花了不少篇幅讲 ChatGPT 的「优化哲学」。

　　他非常想强调的一点是：

　　Nick：我们的目标，不是让用户尽可能留在产品里；相反，而是要帮用户解决长期问题、达成长期目标。这在很多时候其实意味着「在产品里花更少时间」。

　　所以，当 Nick 看到人们把 GPT 视作自己唯一而且最好的朋友时，这并不是他想在 ChatGPT 里主动营造的东西。

　　相反，Nick 将这种「过度停留」，视作一种副作用。

　　比如就在 8 月 16 日，OpenAI 宣布会让 GPT-5 由以前的过于正式，变为更加温暖和友好时，也有网友反对让 GPT-5 过度人格化。

　　如何衡量产品对用户的价值，这是一个值得认真对待和深入研究的问题，OpenAI 也在这个问题上不断探索。

　　如何让 7 亿用户

　　可以毫不含糊地说 YES

　　Alex Heath 问了一个有关产品设计的灵魂问题：

　　Alex：如何平衡「产品目标」与「用户实际使用方式」之间的张力？

　　Nick 说，当你在 7 亿用户的规模上运营，就不得不面对一个现实：你可以有正确而纯粹的目标，你也可以尽最大努力按照这些目标来构建产品。

　　在如何选择上，Nick 提到了一个重要原则——「真正对用户有帮助」。

　　甚至，有时要说出用户可能不爱听的话。

　　基于这一原则，OpenAI 也对产品做了一系列调整：

　　比如，OpenAI 通过与多个国家和大量心理健康专业人士交流，理解当人们过度使用产品，或者在不太健康的状态下使用产品时，该如何处理。

　　并以此修改模型行为，为模型上线了「过度使用提醒」，当用户以极端频率使用 ChatGPT 时，它会轻轻提醒你。

　　Nick 提到了特别重要的一点，也回应了公众对 OpenAI 是否会探索广告模式的猜测：

　　Nick：我们其实并没有任何「让你在产品里花更多时间」的特别动机；我们的商业模式非常简单：基础产品免费，如果你喜欢更多功能，就订阅。没有第二层目的。

　　在这一原则下，Nick 也提到了检验好产品的标准，这也是他们经常给自己设的「思想实验」：

　　Nick：如果你认识的人正经历困难，或许刚失恋，或许对人生感到迷茫——你会不会真的、毫不犹豫、很有信心地推荐他/她使用 ChatGPT？

　　Nick 表示，对于 OpenAI 来说，这就是标准。他们会一直做到自己也有这种底气为止，在此之前他们不会停下来。

　　当然，Nick 也坦言，有时这也是一道艰难的选择题。

　　比如，当有人向你寻求人生建议，或者陷入困境时，你完全可以很轻松地把这些用例直接关掉，对用户说：「抱歉，这个我帮不了你。」

　　这样做的确是条「容易的出路」，但 Nick 和 OpenAI 想要选择的，显然是那条「难而正确的」道路，就是为那些没有资源、没人可聊的人，提供一个好的产品，做到让用户「可以毫不含糊地说 YES」的程度。

　　GPT-5 发布

　　伤害 ChatGPT 了吗

　　Alex：GPT-5 对 ChatGPT 的使用有没有伤害？你们内部统计的总体数字是在上涨吗？最重度用户的使用是在下降吗？

　　面对 Alex Heath 的提问，Nick 对 GPT-5 的表现似乎很满意：

　　Nick：使用和增长看起来都很不错，和我们的直觉也高度一致；我们在第 2 天看到 API 的调用量大幅增长——也就是开发者在用 GPT-5 搭建东西；在 ChatGPT 里，我们也看到了非常积极的增长。

　　用户分层不同，也会影响到对产品的评价，这也是为什么 Nick 提到，在为这么多不同的用户构建产品时，你会有点困惑：

　　Nick：一方面，有一小撮重度用户，我认为他们对我们如何推出 GPT-5 的反馈非常有道理；另一方面，还有大批更典型的普通用户，对他们来说，这可能是第一次真正看到、接触「推理模型」这一概念，以及它能带来的火花。这也会体现在我们的数据里。

　　正如 Reddit 上两级分化的用户评论，GPT-5 发布时间还很短，Nick 并不太想下结论，但所有指标都是偏正面的。

　　Nick 认为，除了看数据之外，还要「待在重度用户所在的地方」，因为数据可能不足以反映他们的情绪。

　　Alex Heath 似乎不依不饶，问：

　　Alex：既然整体指标不错，为什么还要把 4o 带回来？我推测托管就模型也会有成本。如果指标没受伤害，为什么要这么做？

　　Nick 回答道，打造伟大产品的方式是「同时服务两端」：

　　Nick：一端是普通用户，比如我们的家人，他们可能离 AI 还比较远；另一端是极端的重度用户。二者之间「诡异的中间地带」通常不是好位置。

　　这也是 Nick 以 macOS 类比 ChatGPT 的原因：他会参考这样的产品是如何处理这一问题的。

　　Nick 并不讳言，服务旧模型是有成本的。但他更希望能从长远投入，打造一个出色的产品。过于盯着短期指标，通常是把一个产品带向下坡路的方式。

　　Alex Heath 提到了「模型选择」的回归，虽然他能感受到「切换模型」所造成的认知负担，但仍为此高兴。

　　对此，Nick 回应说，会为重度用户，也就是那些可以理解模型，也愿意处理选择模型这层复杂性的用户提供「模型选择」。

　　但对于普通用户，则不必为「切换什么模式」费心，他们可以直接问模型问题，或者让它帮忙做事。

　　「我们会为 90% 的人保持简洁；然后为那群声音更大的重度用户提供他们想要的完整列表。这是一个兼顾两边的平衡方式。」Nick 说。

　　这也是应对网友对 GPT-5 口碑两极分化的好方法。

　　参考资料：

　　https://www.theverge.com/decoder-podcast-with-nilay-patel/758873/chatgpt-nick-turley-openai-ai-gpt-5-interview

ChatGPT负责人深度复盘，爆4o复活内幕！过快下线是失误，将迭代模型人格

我们的产品

相关链接

关于我们

联系我们