刚刚,Meta Skill来了

  Jay 发自凹非寺

  量子位 | 公众号 QbitAI

  GitHub 最新火爆仓库:OpenSquilla。

  继龙虾、爱马仕后又一个开始飞速攀升的 Agent,现在已经 2000 多 star 了。

  快速看了下,最大卖点是其内置了一个「智能模型路由」,这样一来,同样的任务,Token 成本能比龙虾省 60-80%。

  跑任务的时候长这样子,跟个「老虎机」一样。

  很爽,任务做完会弹出一个动画,显示帮你节省了多少 Token,还能溯源各环节 Token 消耗量。

  经常怒省 90% 多,感觉钱包突然鼓了起来。

  实在太夸张了,顶级「守财奴」(bushi)。

  但今天想聊的不是这个。

  他们刚发布了个新功能,叫Meta Skill

  不是那个 Meta,就是直译——元 Skill,Skill 的 Skill。

  一个 Meta Skill 内嵌多个 Skill,拼接到一块就是一本超级白皮书,能端到端打通一整套长程 Workflow。

  △图为 AI 生成

  Meta Skill 实测

  也是很巧,上上周我在把我们 AIGC 产业峰会后台工作做自动化时,其实就有过这个想法。

  大家可能不知道,办这么一场大会其实很繁琐,工作链条非常碎片化。

  之前梳理过 SOP,我负责的部分大概长这样。

  看着很清晰,但其实要自动化的话,就意味着图中每一个蓝色方块,都需要在对话框单独调用 Skill。

  像癞蛤蟆一样戳一下动一下,全程 Human in the loop,光翻个 Skill 列表就够忙活半天,非常烦人。

  所以工作流固化后,我给这堆上下文炼化成了个超级 Skill,端到端了。

  拿到上下文后,它会自动判断现在是处于哪个阶段,然后再调用对应的子 Skill 交付结果。

  再加上心跳机制定时查看状态文档,就可以完全自动化推进。

  但说实话,想创建这么一大包 Skill,真的很麻烦,而且最后结果其实也蛮粗糙的。

  这还是建立在我本身对内容行业有 Know-How的前提下,如果涉及到需要跨行业专家经验整合的任务,照这么排列组合 Skill,那真得是灾难了。

  所以我一直在疯狂寻觅,有没有像 Claude 自带 Skill 那种,提前封装好的。

  (伸手党 ing)

  没想到,前天一看,GitHub 上还真有这么个仓库!

  9 个封装好的 Meta Skill,内嵌在 Agent 里那种。

  咱挑个实测下吧,就选这个叫meta-kid-project-planner的。

  一个给儿童项目规划用的 Meta Skill,当孩子需要做科学展项目、兴趣手工、创意小发明啥的,它能帮助孩子从零开始制定一个可执行的项目计划。

  主要最近不正好是六一吗,感觉还挺合适的。为了偷懒 ,场景就设计成让小朋友自学 Meta Skill,帮我给大家讲讲这 9 个 SKill 分别都是干嘛的。

  Prompt 长这样:

孩子 9 岁,想做一本 Meta Skill 魔法书,先网页呈现再做纸质小书,每页介绍一个咒语。

  不用写很详细,正式开工前,它会根据 Skill 指令,要求你提供更多信息。

  然后,就进入「彻底疯狂」时间了。

  太离谱了,嗖的一下吐出来这么多执行轨迹,把需求拆分成了一长串子任务。

  全程无需人介入,自己跑了 20 多分钟,最终交付了一份完整的 7 天项目规划包。

  确实挺面面俱到的,甚至考虑到是小朋友,还额外做了一轮安全审查

  甚至给各种预案都做好了。

  咋做到的?

  我翻了一下这个 Meta Skill 的 SKILL.md 源文件,大概流程是这样:

  1、立项:询问用户偏好,年龄、周期、预算、家长参与度。

  2、可行性分类:判断安全不安全、需不需要大人帮忙、要不要额外买东西。

  3、执行:分步计划→材料清单→安全提醒→家长学习目标→最终组装交付。

  如果涉及到户外活动,甚至会调用 web search 查天气……

  △图为 AI 生成

  整套工作流,由5 个不同的原子 Skill拼接而成。

  最后的交付结果就是上面那个项目规划包 md,3000 字左右

  但为了方便看,我又让它用 Claude Opus 4.7,基于这些上下文搓了个HTML

  交互逻辑跟实体书一样,每次翻页都有动画。

  一共 9 个 Meta Skill,都是遵循我「哈利波特风格」的指令讲解的。

  最后还有一个「魔镜魔镜」功能,方便小朋友根据需求选择 Skill。

  网页已经部署了,链接在文末,大家如果不想看 MD 的话,可以通过这种形式了解这 9 个 Meta Skill。

  对了,还有个挺重要的事。

  实测下来,感觉这个Squilla 路由确实能省蛮多钱,不会啥都让 Claude 来处理。

  比如像这种问题,就只花了我三分钱。

  弱智

  (ps:DS 降价后真的很香啊!!)

  看了下这个 Token 成本 Benchmark,还是挺有冲击力的。

  当然,你也可以自己选择要不要打开,或者直接 Prompt 要求锁定到某个模型。

  最后说下咋安装。

  说实话,其实还挺简单的,只要你装过龙虾,就支持一键迁移数据资产、API Keys。

  比较烦的是,Mac 得走终端安装,目前只有Windows 支持压缩包

  但也没关系,Mac/Linux 直接在终端按顺序复制粘贴这串代码就行,之后遇到啥问题都交给 codex。

  #Install uv:curl-LsSf https://astral.sh/uv/install.sh | sh."$HOME/.local/bin/env"#Install OpenSquilla:uv tool install --python3.12"opensquilla[recommended] @

  https://github.com/opensquilla/opensquilla/releases/download/v0.3.0/opensquilla-0.3.0-py3-none-any.whl"#Configure and run:opensquilla onboardopensquilla gateway run

  显示这个界面,就是安装成功了。

  入口方面,支持各种主流 IM,飞书、Discord、QQ……大家选最习惯的就行。

  但我还是推荐使用他们的 Web 版,也没啥特别原因,只不过「智能路由老虎机」「Token 节省动画」只有网页端能显示。。。

  如果用终端或 IM 的话,会少蛮多快乐的。

  秘诀是什么?

  说到这,可能有人纳闷:刚才那个跑了整整 20 分钟的项目规划包,过程中又是调搜索引擎、又是查天气、又是翻记忆、又是做安全审查……这些活,谁在安排?

  之前的 Agent,一个 Skill 干一件事,搜索归搜索,文档归文档,天气归天气。你自己手动串流程,脑子里得一直装着下一步该使唤哪个 Skill。

  而如今,Meta Skill 接管了这个「调度员」角色。

  你可以把它理解成一份「项目经理的操作手册」——哪些步骤并行那些步骤串行、哪个步骤的产出要喂给下一个步骤……全写在里面。

  但光有项目经理还不够。

  一个只会排活的 PM,如果每一步都叫最贵的外包来干,那公司要不了多久就得倒闭了。

  这就是为什么,我一直在 cue 智能路由。它真的默默承担了太多。

  你前面看到的那个「老虎机」,就是帮这位 PM 做预算管理。每一个子步骤经过的时候,路由会帮你死死夹紧钱包。

  比如刚才那个 kid-project-planner,提取孩子年龄和偏好这种活,DS 就够了;只有生成安全审查方案和 14 天规划这种步骤,才需要分配给参数更大的模型。

  最后,项目经理有了,预算管理也有了。但还有个问题——

  PM 的操作手册,谁来写?

  Meta Skill 是好,但关键是,真的很复杂啊!!

  据个人经验,刚才那个 kid-project-planner,400 多行 SKILL.md,即便跟 AI 迭代也要大概 30 分钟,这还是建立在你脑海中已经有清晰的 SOP 的前提下。

  所以说,一个创建 Meta Skill 的 Meta Skill(好绕好绕),也是很有必要的。

  叫做meta-skill-creator,这也是我觉得 OpenSquilla 这次发布的 9 个 Skill 中,最重要的一个 Skill。

  推荐大家去仓库读下这个 md,能看懂这个,基本就能搞明白整个 Meta skill 的工作原理了。

  但如果没时间,也可以直接看这个 AI 生成的讲解图。

  △图为 AI 生成

  到这一步,所有 Meta Skill 门槛都已解决。

  但团队还想到了件更远的事情——

  供需匹配问题。

  当 Creator 不断产出新的 Meta Skill,社区也在不断贡献新的,Skill 膨胀的问题怎么解决?

  现在仓库里只有 9 个,但如果未来有上百个 Meta Skill,你怎么知道哪个最适合你的场景?

  OpenSquilla 给出的解决方案是:「个人×社区」的索引协议。

  你平时常用哪些 Skill、偏好什么组合顺序、哪个试过不好使……这些会作为信号,被 Agent 拿去匹配社区里别人做好的 Skill,然后根据你的工作流缝合出个新的。

  简单来说就是个自动的 Skill 推荐引擎。

  Skill 2.0 时代,来了

  最后,咱们再来细细扒下这个仓库的版本历史,这个视角挺有趣的,可以像抽丝剥茧一样,逐步揭开他们的产品思考——

  5 月初是靴子首次落地,发布了智能路由,最开始以为只是单纯做 Token 优化的。

  如今,随着 Meta Skill 的出炉,这个鞋印终于开始清晰了起来,并且指向了一条反直觉方向。

  它同时踩在了三条线的交点上——

  1、模型。

  复杂多步骤指令的理解能力这两年飞速拉升,Agent token 数据飞轮已经开始转了。

  模型已经「听得懂」复杂的编排指令了,这是一切的前提。

  2、生态。

  社区创建的 Skill 在爆发式增长。

  从用户手写,到基于数据自动生成,再到社区汇集分享……当可选的 Skill 有成千上万个的时候,需要一个更高的抽象层即 Meta Skill,去简化掉 Skill 筛选成本。

  3、成本。

  大规模跑大模型依然贵。你每次让 Agent 在线上 trial-and-error,反复摸索最优路径,Token 烧掉一大堆。

  通过 Meta Skill,能直接固化这层复杂度,将优化问题前置到 Skill 层。

  而这三个痛点,同时指向了又一次正在被倒逼出来的范式迭代。

  Skill 2.0。

  单个 Skill 已经不够用了,自动化想要进一步深入,必须要学会对多个子 Skill 排列组合。

  Agent 下一步要解决的问题,已经从「会不会调用工具」,变成了「会不会组织工具」。

  但从另一个角度来看,其实也蛮令人兴奋——

  当多个 Skill 碰撞在一起,会创造出怎样的想象空间?

  毕竟,最近这段时间,不少模型都推出了自己的 Agent 团队,腾讯有 Marvis、MiniMax 有 Mavis、Kimi 有 Agent 集群……

  但 Skill 层,似乎还停留在刚被 Claude 带火时的那个阶段,社区基本都还在为单个模型写 SKill.md。

  所以我觉得,多 Agent 的潜能,其实一直没能被完全释放。

  而这次 Meta Skill 的出现,让我看到了一种可能性——专为 Agent 团队设计的白皮书,赋予模型更宏观的全局上下文。

  Agent 和人类在面对的很多核心问题上,其实殊途同归。

  当员工(Agent)变多,业务(Skill)变多,必然会遇到指数级放大的噪音。

  此时,如何善用架构和管理去做熵减,就非常有必要了。

  欢迎打开 Meta Skill。

  这是用来指导 Agent 三省六部的白皮书。

  OMT

  对了!等等,先别点出去。

  我在调研时发现个奇怪的事——

  明明这么火的项目,只有X上有官方账号,而且第一个版本就被 AK 大神转发,却一直不知道团队是谁,相当神秘。

  一打听说是个中国团队,所以更好奇。

  AI 挖掘半天无果,最后还是选择发动古法,四处找人打听了下,没成想王云鹤的最新创业动态就这么被曝光:

  OpenSquila,来自他创立的名为「基元律动」的公司,团队正大力招兵买马。

  原来只是团队刚刚开始,希望专注打磨产品。

  让子弹再飞一会儿,我们拭目以待。

  GitHub:https://github.com/opensquilla/opensquilla

  Skill 魔法书:https://imtangyujing.github.io/opensquilla-meta-skill-grimoire/