国思软件 - OpenAI大神教你如何榨干Codex

　　闻乐发自凹非寺量子位 | 公众号 QbitAI

　　新晋员工确实毫无保留。

　　Jason Liu，13k 星开源库 Instructor 的作者，刚被 OpenAI 招进 Codex 团队没多久，不仅在社交平台大方发 API 额度；

　　还写了篇Codex-maxxing，把自己的 Codex 玩法全抖出来了。

　　而且是让 Codex 自动跟进亚马逊退款、定时扫 Slack 接需求、开着 Heartbeats 在你洗澡的时候帮你干活的那种。

　　Codex 周活用户 4 月底已经破了 400 万，终于来了份“官方使用指南”。

　　正好，这两天 Codex 又更新了一波：Appshots 截图直喂、Goal 模式正式转正、锁屏后也能远程干活

　　跟 Jason 的使用心法叠在一起看会发现，现在大家比拼的，是谁能持续工作更久，谁能真正上岗了……

　　让它自己跑起来

　　Jason 整套玩法的核心，是把 Codex 改造成了一个能长期运行、持续接管任务的工作系统。

　　多数人习惯单次问答结束就关闭会话，但 Jason 是开着一堆跨月存活的巨型线程，不会随意终止。

　　他给每个工作流一个置顶线程：管日程的一个、管开源项目的一个、监控社交平台的一个……通过 Command-1 到 Command-9 一键跳转。

　　线程里积累了几个月的对话历史、偏好和决策，再次使用时不用重新交代背景，Agent 就能自动承接进度。

　　当线程生命周期被拉长后，项目背景、沟通习惯和历史决策都会自然沉淀进去，Agent 开始具备连续性。

　　而且 Jason 下任务不打字，主要靠说。

　　在他看来，口述能完整保留原始思路，不需要刻意优化 Prompt，可以直接把模糊、跳跃、带溯源需求的想法原样丢给 Agent。

　　再配合 Codex 的 Steering 功能，还能在 Agent 执行任务时插队追加指令，说完就走，不用干等。

　　不过，真正让 Codex 从工具变员工的，是Heartbeats+@computer这套组合拳。

　　Heartbeats 本质上相当于给 Agent 加了一层定时任务调度。

　　Jason 有个 Chief of Staff 线程，每 30 分钟跑一次——扫一遍 Slack 和 Gmail，看看有没有需要回复的消息，判断优先级，需要回复的先起草一份草稿，但不发送，最终由人来决定是否发出。

　　他还举了一个更复杂的例子是，做动画项目时，他会先把视频发到 Slack 审阅线程，然后让 Codex 每 15 分钟检查一次线程。

　　如果同事提了反馈，Codex 就重新渲染一个新版本并回复到线程里。

　　因为 Slack MCP 服务器还不支持文件上传，Agent 甚至会自己调用@computer 去点“Add file”按钮，把渲染好的文件传上去。

　　还有一次，Jason 在洗澡前让 Codex 盯着亚马逊客服排队状态，结果等他洗完澡出来，退款已经到账了。

　　类似的流程，现在已经能扩展到 Google Docs 评论、GitHub PR Review 等场景，只要有反馈就自动推进下一步。

　　Jason 最强调的一点，是验证机制，可以判断任务什么时候终止。

　　他试过让 Codex 把 Python 的 Rich 库完整迁移到 Rust，硬性要求是必须通过原 Python 库的所有单元测试。

　　测试能不能通过，决定了任务是否完成；失败了，Agent 就继续修。

　　用他的话说：

没有验证机制的野心，顶多算个愿望而已。

　　而在最新的这次更新中，OpenAI 已经把Goal 模式从实验版本转正了

　　你只要明确一个最终目标和验收标准，Codex 会自主持续推进，短则几小时长则数天，中途可以查进度、调方向，也可以直接暂停。

　　但前提是任务本身必须存在清晰、可验证的反馈闭环。

　　记忆放在自己手里

　　Jason 这套用法的另一大核心思路，是个人工作记忆不应该托管在平台内部

　　他所有的长期线程都从一个 Obsidian vault 起步，目录划分为 TODO、people、projects、agent、notes 等板块。

　　在顶层 AGENTS.md 里写明规则：人员信息更新、项目推进、待办办结等变动，都要同步更新知识库对应内容。

　　也就是说，他几乎放弃了 Codex 的内置记忆系统，把核心记忆数据存放在本地可控文件中，既能随时查阅手动修改，也能通过版本对比查看变动，出现问题还能一键 roll back。

　　原因是 AI 承载的记忆体量越大，就越不该把数据锁死在单一平台。

　　而文件是完全属于用户自己的，后续想换工具、迁平台，拎着知识库就能走，毫无顾虑。

　　他也提到了 Codex 自带的记忆功能Chronicle，通过截取屏幕内容来构建上下文。

　　但这是需要手动开启的实验预览功能，在权限、速率和隐私方面存仍在短板，整体方向可行但还不够成熟。

　　所以，在他看来，文件系统仍然是最可靠的记忆基础设施。

　　而且 Codex 工作台本身也在升级。

　　Codex 的侧边栏不再局限聊天交互，可直接渲染 Markdown、筛选表格、阅览 PDF 与 PPT。

　　Agent 还能通过内置浏览器用 JavaScript 控制网页，用户可以边看边标注，不用来回切窗口。

　　Jason 说他经常在侧边面板里同时打开 Storybook 审阅 UI 组件、用 Remotion Studio 做动画、用 Slidev 做演示文稿。

　　而他最喜欢的交付形式，就是一个带 JS 和 CSS 的单文件 index.html，不用部署，不用服务器，打开就能跑。

　　另外，他还把 Connectors 和 Skills 作为可复用工作流模版。

　　只要成功做完一件有用的事，就把流程打包起来，下次 Codex 不用重新学，直接调用就行。

　　最近 Codex 还补了一手远程能力，电脑锁屏后 Codex 可以继续工作，手机端也能实时查看、审批甚至接管任务。

　　现在好了，你下班它加班，你锁屏它干活，超额 KPI 这不就来了……

　　不过，当 AI 可以持续接管工作，人自己倒是越来越轻松了（doge）。

　　参考链接：https://x.com/jxnlco/status/2057153744630890620

OpenAI大神教你如何榨干Codex

我们的产品

相关链接

关于我们

联系我们