扣子3.0实测:手机就能远程遥控你电脑里的Agent

  金磊发自凹非寺

  量子位 | 公众号 QbitAI

  扣子,来了个大版本的升级——3.0 正式发布!

  现在做一个游戏,只需要给扣子看一眼就行。

  例如我们给扣子发了个视频,然后只说了一句:看一眼这个游戏,做一个类似《我的世界》的游戏项目。

  一气呵成,一气呵成。

  即便 Prompt 如此之简单,但《我的世界》界面、操作和交互,都在短短几分钟之内被扣子实现了出来。

  但这个并非是扣子 3.0 这次大版本更新的重点。

  这一次,扣子没死磕一个 AI 让它抗下所有事,反之,是让一群术业有专攻的 Agent,组团来给你打工

  一句话概括,就是——

  @一下,新一代 AI 团队,全队开工了。

  除此之外,扣子的手机端 (iOS / Android)、电脑端(Mac OS / Windows)、网页端(coze.cn),也统统一道儿完成了更新。

  你甚至可以用手机远程遥控电脑来完成工作!

  那么现在的扣子 3.0,它还能替我们做些什么具体的工作?效果又如何?

  一波实测,Let’s go!

  @一下就能全员就位

  先来看第一个实测。

  我们给扣子 3.0 抛了一个科技媒体编辑非常高频的需求:

  做一个AI 热点追踪仪表盘的网页 Demo,用来每天追踪 AI 行业热点。

  这个需求看起来简单,但真正做起来并不只是写个页面。

  编辑要先判断今天哪些新闻值得写;还要补背景、查事实、找角度;接着要把需求拆成页面模块;最后才是代码实现。

  所以我们没有让一个 AI 从头干到尾,而是在同一个项目里安排了 4 个 Agent 协作:

  其中,小曜是扣子 3.0 自带的 Agent;选题写作 Agent、产品设计 Agent 和前端开发 Agent,则是通过新建云端 Agent 的方式来自定义的。

  在创建好需要的 Agent 之后,我们只需要新建一个项目,@这个几个 Agent,然后附上一段 Prompt 即可:

  做一个“AI 热点追踪仪表盘”的网页 Demo,用来每天追踪 AI 行业热点。 页面要求也尽量贴近真实工作场景:顶部是“今日 AI 热点总览”,中间是 6 张热点卡片,每张卡片包含标题、热度、写作角度和风险提醒;右侧是“选题优先级排序”;底部给出“今日可写文章标题建议”。

  任务下达瞬间,几个专家 Agent 就各自开忙了:

  在 Agent 们有来无往地交流过后,一个 AI 热点追踪仪表盘就这么水灵灵地诞生了!

  以前的 AI 处理这类任务,通常会得到一个大而全的回答:前面讲选题,中间讲页面,后面突然开始写代码。

  但扣子 3.0 的工作方式更像项目推进,整个过程的价值,在于它把一个复杂任务拆成了不同角色的连续劳动。

  在上面的实测中,拉进项目里的 Agent,正如我们刚才提到的,要么是扣子 3.0 自带的,要么就是在云端新建的。

  不过对于你在本地已经用熟练的Agent,例如 Claude Code、Codex CLI、OpenClaw 等,扣子 3.0 现在也是支持一键导进来的。

  如此一来,这事就从自己组一个 AI 团队,变成了把你原来用顺手的 AI 工具也拉进团队。

  这一次,我们就可以用扣子 3.0 做一个更工程化的事儿了:

  还是做“AI 热点追踪仪表盘”,但要求不只是生成页面 Demo,而是变成一个本地能跑的项目。

  再接下来,我们进一步做个更有产品感的实测——

  做一个AI 编辑部桌宠

  Prompt 是这样的:

  开发一个“AI 编辑部桌宠”的网页应用 Demo。它常驻在电脑桌面角落,面向科技媒体编辑使用。技术栈使用 React + Tailwind,整体风格可爱、轻量、有科技感。 桌宠形象可以是小机器人、小猫或者小光球,需要有 4 种状态: 待机时眨眼、轻微漂浮;思考时头顶出现加载动画;提醒时弹出气泡,说“今天还有 3 个热点值得跟进”;夸夸状态下,完成任务后给编辑一句鼓励。 左侧是“今日任务”列表,包括追热点、查资料、写标题、改稿子。右侧是“桌宠对话气泡”,展示它给编辑的提醒。底部有三个按钮:“帮我找选题”“帮我改标题”“提醒我休息一下”。 点击不同按钮后,桌宠状态要发生变化。 点“帮我找选题”,桌宠进入思考状态,并输出 3 个 AI 行业选题;点“帮我改标题”,桌宠给出 3 个更吸睛的标题版本;点“提醒我休息一下”,桌宠切换成关心语气,提醒用户休息。

  虽然这类应用很迷你,但却足以考验扣子 3.0 几件事:

  能不能把一个模糊创意变成清晰产品结构,能不能把好玩和有用结合起来,能不能直接生成可运行代码并说明后续如何扩展。

  从效果来看,扣子 3.0 已经做到了从产品设定、交互逻辑、前端页面,一直走到后续工程扩展。

  实测继续。

  我们接下来再把一个选题内容直接变成一个视频

  首先,我们在编辑部群里,@多个 Agent,用下面这句 Prompt 生成一篇文章(有种让 Agent 自己卷起来,我们只需 pick 好的结果的感觉):

  选择今天一篇关英伟达的选题,并生成 1000 字的科技文章。

  然后我们新建一个视频项目

  把刚才生成好的文章丢进去,再附上一句简单的 Prompt:

  生成一条 45 秒短视频方案,风格要科技感、节奏快,适合微信公众号视频号或小红书传播。

  视频生成项目默认的模型是Seedance 2.0,也有很多视频的风格可选择:

  不到一会,适配编辑部文章的短视频就好了:

  短视频创作的麻烦,在于它从来不是单点任务。脚本、分镜、角色、道具、镜头、字幕、配乐、剪辑节奏,每一个环节都能单独写一大段,但真正难的是它们要互相对齐。

  扣子 3.0 的项目化能力在这里能发挥作用:角色、道具、文档等资产可以在项目里沉淀下来,后续不必每次重新定义。

  最后一个实测,是手机和电脑的联动

  我们在本地电脑桌面上放了一个英伟达财报的 PDF,然后在扣子 3.0 的手机端,直接让它从电脑桌面读取文件并解读:

  我电脑桌面上有一个英伟达财报的文件,帮我调取并做分析。

  过去很多 AI 工具最大的断点就在这里:它能给建议,但拿不到你的本地材料;它能写提纲,但不知道你电脑里那份速记到底讲了什么;它能分析趋势,但你还得先把文件上传、整理、复制、粘贴。

  桌面端和移动端打通后,Agent 可以在获得授权的前提下处理本地文件,任务也能在手机上继续推进。

  如此一来,任务便不再被某一台电脑绑住,这正是 Agent 产品从工具走向协作对象的关键。

  这次是真的能拉项目

  把这几组实测放在一起看,扣子 3.0 最重要的升级,其实可以拆成三层。

  第一层,是项目化。

  过去很多 AI 对话更像临时问答,你今天问一个问题,明天再问一个问题,中间的资料、角色、产物经常散落在不同会话里。

  扣子 3.0 把任务从对话推进到项目。资料、角色、任务、产物都放进一个项目空间里,围绕同一个目标持续推进。

  这点其实是很重要的。

  因为真实工作很少是一问一答解决的。写一篇稿子、做一个 Demo、剪一条视频、开发一个小应用,都需要多轮推进、多角色协作、不断沉淀中间产物。

  第二层,是 Agent 编排。

  扣子 3.0 强调多人多 Agent 协作,不是把几个模型摆在一起让用户自己切,而是让不同 Agent 按角色参与任务。

  选题 Agent 负责判断,资料 Agent 负责补背景,产品 Agent 负责拆结构,代码 Agent 负责实现,本地 Claude Code 或 Codex 负责工程检查。

  角色清楚之后,任务自然就更容易推进。

  这也解释了为什么“@一下全员就位”是这次升级的核心表达,因为用户需要的是一组可以被调度的 AI 伙伴。

  第三层,是工具链打通。

  Agent 要真正干活,不能只停留在对话框里。

  扣子 3.0 这次覆盖了编程项目、视频项目、本地 Agent 接入、行业技能包、多端同步、桌面端本地文件处理等一整套能力。

  编程项目里,可以做网页、App、小程序,支持导入 GitHub 项目或本地项目继续开发,也支持一键部署到线上。视频项目里,可以围绕剧本、分镜、视频、音乐、续集生成持续迭代。行业技能包则把自媒体、法律、金融、互联网、医疗健康等场景里的专业能力打包成可调用的技能。

  换句话说,面对一些垂直行业里的复杂任务,用户不需要从零调教 Agent,也能先加载一套更接近专家经验的解题模板。

  更准确地说,这些技能包不是简单给 Agent 加几个提示词,而是把行业数据库、专业方法和高频工作流封装成可调用能力。

  比如金融场景里,可以围绕A股、基金等任务调用实时数据引擎和专业分析能力;法律场景里,可以检索法律法规和专业内容,辅助合同审阅、诉讼策略材料整理;医疗健康场景里,可以识别体检报告、结构化提取关键信息、整理健康档案;自媒体和科研场景里,也有爆款笔记洞察、标题生成、论文检索、文献引用溯源等技能。

  这意味着,Agent 不只是更会回答,而是能带着更贴近行业经验的能力进入具体任务。对新人来说,它降低了从零摸索的门槛;对专业人士来说,它可以先接住检索、整理、初稿、结构化分析这些高频环节,把人的时间留给真正需要判断和经验的部分。

  这些能力放在一起,才让 Agent 从会说走向能做。

  从谁更聪明,到谁更会打配合

  过去一年,AI 产品的竞争很容易被简化成模型能力竞争:

  谁更聪明,谁推理更强,谁写代码更好,谁上下文更长。

  这些当然重要,但到了 Agent 产品阶段,另一个问题开始变得更关键:

  一个 AI 再聪明,能不能和其他 AI、工具、人类一起工作?

  扣子 3.0 给出的答案,是把 Agent 产品做成一个协作系统。

  它面向的不只是开发者,也包括创作者、复杂业务工作者和新手用户。

  开发者可以接入 Claude Code、Codex CLI、OpenClaw 等本地 Agent,也可以在编程项目里并行开发;创作者可以把脚本、分镜、视频、音乐和续集放进同一个项目;复杂业务工作者可以调用行业技能包;新手用户则不需要理解 API、MCP 这些概念,也能先从一个项目开始。

  这背后其实是 Agent 产品的一个重要方向:

  真正好用的 Agent,不应该只比单点能力,而要看它能不能进入真实工作流。

  能不能把任务拆开,能不能接住上下文,能不能调用工具,能不能沉淀资产,能不能跨端延续,能不能让用户少切窗口、少搬材料、少重复解释。

  如果说早期 AI 产品像一个随问随答的聪明人,那扣子 3.0 想做的,更像一个能开工的小团队。

  它不一定每个环节都替你做到极致,但它开始让不同 Agent 围绕同一个项目协作起来。

  这就是这次升级最值得关注的地方。

  AI Agent 的下一步,不只是更强的模型,而是更像真实团队的工作系统。

  以后你打开一个项目,@一下,AI 全队开工。