梦晨发自凹非寺
量子位公众号 QbitAI
要花1450 元才能玩到 Operator,让本来满满期待的大伙,一下难受住了。
而交了钱的各位,开始兴奋的晒出各种测试结果。
有网友分享,Operator 通过浏览网页在 3 分钟之内帮打找到了附近牙医诊所,回报了地址和电话。
也有人让它作为研究助手,在 arXiv 上挨个打开每篇论文,看完后输出总结。
也有“坏人”专门出难题,看 AI 如何应对:让 Operator 到 ChatGPT 官网使用 Operator 会如何?
但没想到 OpenAI 预判了他的预判,直接给出一个嘲讽式报错。
试得好,下次别试了。
强如 Operator,上网冲浪时也会被验证码难住,但好在它学会了向人类用户求助:
我遇到了一个验证码……你能接管并帮我搞定吗?
没错,这只是一个早期预览版。
参与发布直播的基础研究贡献者(Fundamental Research Contributor)Casey Chu认为,它会犯错误,但它让你提前窥见未来。
而且他的这个帖子,就是 Operator 寄几发的,成功套娃了:
核心贡献者(Core Contributor)Yilong Qin认为,测试时间计算的 Scaling Law 在这里继续发挥威力。
给 Agent 更多时间,它会内省、更新、一遍又一遍地尝试直至最终成功。
同为核心贡献者的姚顺雨表示,有了强化学习的新范式,Operator 的进步速度会像从 o1-preview 到 o3 一样。
同时他介绍,Agent 是 OpenAI(甚至是 AI)诞生以来就有的目标,在发展过程中做了多次尝试。
但只有发现 GPT 和草莓(o1)两种新范式后,Agent 的潜能才真正被解锁。
2025 年将是 Agent 之年。
他为什么这么说?还要从 OpenAI 成立之初讲起。
OpenAI 的十年 Agent 之路
早在 2016-2017 年,OpenAI 就通过 Word of Bits 和 Universe 探索了让 AI 操作浏览器上网。
Word of Bits由 OpenAI 与斯坦福大学合作,参与者包括大家熟悉的 Karpathy 和 Jim Fan、斯坦福大学副教授 Percy Liang 等,以及姚班校友施天麟。
施天麟只在 OpenAI 工作了一年,随后在 2017 年创办了 Cresta,业务正是 AI Agents 方向,专注于为客服中心提供各种 AI 助手。
2024 年 11 月,Cresta 完成 1.25 亿美元D轮融资,总融资金额达到 2.7 亿美元。
OpenAI Universe则是一个 Agent 训练和测试的平台。他们从李飞飞的 ImageNet 上受到启发,希望能把图像识别任务上的快速进步复制到 Agent 领域。
2017 年的 Universe 已经能让 AI 完成一些简单的浏览器操作,以及玩 Atari 游戏等任务。
但随后不久,OpenAI 就把主要精力从强化学习转向了语言模型 GPT 系列上。
2021 年底,到了 GPT-3 时代,OpenAI 不忘初心推出WebGPT,使用基于文本的 Web 浏览器更准确地回答开放式问题。
这项研究把 GPT-3 回答开放式问题的真实性和有用性从 20%-30% 提升到了 40%-80%,但仍未达到人类平均水平。
WebGPT 的作者中,有 4 位也出现在最新的 Operator 贡献名单里,分别是欧阳龙,Christina Kim,Reiichiro Nakano,Kevin Button。
其中Reiichiro Nakano(中野礼一郎)是 Operator 项目的研究主管之一,也出现在了发布直播中。
△Sam Altman,Yash Kumar,Casey Chu,Reiichiro Nakano
最新的 Operator 背后模型命名为 CUA(Computer Use Agent),与此前的探索相比,有了几项重大突破:
- 多模态理解带来“感知”能力,由 GPT-4o 提供。
- 长上下文作为“任务视野”,让 Agent 能连续执行任务长达 20 分钟。
- o1 式的思维链推理,这种内心独白使模型能够评估其观察结果、跟踪中间步骤并动态适应。
参与、观察了整个十年发展过程的 Karpathy 总结到:
Operator 之于数字世界,就像人形机器人之于物理世界。
在数字世界的发展速度要比物理世界更快,因为翻转比特的成本相比移动原子只有约1/1000。
……
与其说 2025 年是 Agent 年,不如说 2025-2035 年是 Agent 的十年。
World of Bits
https://proceedings.mlr.press/v70/shi17a/shi17a.pdf
Universe
https://openai.com/index/universe/
WebGPT
https://openai.com/index/webgpt/
Operator
https://openai.com/index/openai-gym-beta/
参考链接:
- https://www.reddit.com/r/singularity/comments/1i8fi3l/openai_operator_finds_me_an_in_network_dentist/
- https://x.com/omarsar0/status/1882545077219926031
- https://x.com/liambolling/status/1882565960697282812
- https://x.com/caseychu9/status/1882507704566235407
- https://x.com/yilongqin/status/1882507643669123230
- https://x.com/liambolling/status/1882565960697282812
- https://x.com/karpathy/status/1882544526033924438