12 月 6 日消息,美国时间周四,OpenAI 正式推出其 o1 模型完整版,该模型已从预览阶段升级成为 ChatGPT 平台的核心功能之一。这一模型在推理能力上实现了显著提升,并新增了图像分析功能,为多领域应用带来了重要突破。
新版 o1 模型支持用户上传图片,AI 会根据图像提供详细反馈。例如,用户随手拍一张鸟舍照片后,AI 就能够提供完整的建造方案。此外,o1 模型还能根据草图帮助规划数据中心,从设计初期就提供详细指导。
目前,o1 模型向 ChatGPT Plus 和 Team 的全球订阅用户开放,并预计下周向企业和教育用户开放。这一升级标志着推理模型能力的重大飞跃,包括在处理复杂任务、图像推理以及整体准确性方面的显著进步。
与 o1 模型的发布同步,OpenAI 还推出了全新的高级订阅服务——ChatGPT Pro。该服务月费 200 美元,专为需要研究级人工智能工具的专业人士和组织设计。
ChatGPT Pro 为用户提供对 OpenAI 最先进功能的无限制访问,包括 o1 推理模型的专属版本、GPT-4o 以及高级语音功能。这些增强功能旨在为用户提供更强的计算能力和更高的精确性,满足复杂应用场景的需求。
OpenAI 联合创始人兼首席执行官萨姆·奥特曼(Sam Altman)于 12 月 5 日通过 YouTube 直播宣布了这一消息。该发布是“OpenAI 的 12 天”(12 Days of OpenAI)系列更新的一部分,与年末和冬季假期的庆祝活动相呼应。
o1 的突破进化
o1 系列模型首次亮相于 2024 年 9 月,目标是凭借其先进的推理、编码和数学能力,解决现实世界中的复杂问题。
相比其预览版,升级后的 o1 模型在响应速度上取得了显著提升,同时将处理复杂问题时的错误率降低了 34%。更值得关注的是,该模型新增了图像分析与解释功能,这为其在医疗、工程等领域的广泛应用打开了全新的大门。
早期基准测试显示,o1 模型在竞争中具备明显优势。例如,在国际数学奥林匹克资格考试中,o1 预览版成功解答了 83% 的题目,而 GPT-4o 的成功率仅为 13%。此外,o1 预览版在严格的安全测试中得分高达 84 分,相较于前代模型的 22 分,取得了显著提升。
OpenAI 计划进一步拓展 o1 模型的功能,包括支持网页浏览、文件上传以及更丰富的 API 集成,从而提升其在视觉内容处理、函数调用和结构化输出等领域的能力。这些改进使得 o1 模型成为 STEM(科学、技术、工程、数学)领域用户,以及其他行业从业者的得力助手。
OpenAI 研究员诺姆·布朗(Noam Brown)在社交媒体上确认,o1 正是此前内部代号为“草莓”(Strawberry)的模型。他幽默地指出:“o1 的能力绝不仅限于计算‘草莓’这个词中有多少个‘r’。”布朗还分享了一张截图,显示 o1 模型在经过 45 秒“思考”后,通过 ChatGPT 生成了一篇关于草莓的完整三段文章,且全篇未使用字母“e”。
高级订阅的定价策略
ChatGPT Pro 的推出标志着 OpenAI 在满足高端用户需求方面迈出了重要一步。这一订阅服务解锁了高计算性能的 o1 版本,为用户提供额外的计算能力,专为处理复杂查询和优化解决方案设计。此外,用户还可享受 GPT-4o 的先进自然语言生成能力以及高级语音交互功能。
相较于 ChatGPT Plus(月费 20 美元)和 ChatGPT Team(月费 30 美元),ChatGPT Pro 以其专为复杂应用场景设计的顶尖性能彰显了其高端定位。
为了推动 AI 在社会福祉领域的应用,OpenAI 还宣布了“ChatGPT Pro 赠款计划”。该计划初期将向 10 位医学研究人员提供资助,免费使用 ChatGPT Pro 工具,以支持医学领域的研究与应用。
恰逢其时的发布
在人工智能行业竞争日益加剧的背景下,o1 模型和 ChatGPT Pro 的推出成为 OpenAI 的重要战略举措。
包括阿里巴巴和 DeepSeek 在内的中国竞争对手,已分别发布了 Marco-o1 和 R1-Lite-Preview 等推理模型。这些模型凭借开源解决方案迅速抢占市场,不仅对 OpenAI 的领先地位发起了挑战,还在某些第三方基准测试中超越了 o1 预览版的表现。
这一系列动态反映了市场对大型推理模型(LRM)的强劲需求。这类模型以其出色的复杂问题解决能力,正吸引越来越多的关注。
随着 OpenAI 不断优化其产品,o1 模型和 ChatGPT Pro 的推出标志着其在提供高性能且易于使用的人工智能工具方面迈出的重要一步。然而,在这个日益拥挤且竞争激烈的市场中,OpenAI 能否凭借这些进步维持其领导地位,仍需时间来验证。(小小)