刚刚,国产Agent模型闯入全球第一梯队!限时免费

  谁懂啊家人们??

  Agent 时代,大公司都在把“烧多少 token”当 KPI 了,本小小员工还深陷另一个泥沼:

  聪明的模型用不起,便宜的模型不够聪明。

  想找一个又能打又不贵、还能在主流 Agent 环境里即插即用的模型?过去基本没有。

  然而就在刚刚,我发现有一位国产玩家,悄悄打破了这个“不可能三角”。

  其新发布的 Agent 模型,性能已经站到全球第一梯队——甭管对面是开源还是闭源,凡是你能叫得上名字的顶尖选手,它都能与之掰一掰手腕。

  而且价格确实惊到我了,只有主流顶尖模型的一半甚至更低。

  更关键的是,模型深度适配了 OpenClaw、Claude Code、Hermes、Nanobot 等主流 Agent 框架,还兼容 OpenAI 接口。开发者几乎不用改架构和代码,很多时候换个 baseURL 和 API Key 就能直接跑。

  说了这么多,想必你已十分好奇来者何人了?⊙.☉

  答案这就揭晓:昆仑万维。具体模型则是 SkyClaw-v1.0 及其轻量版 SkyClaw-v1.0-lite。

  悄咪咪透露,两款模型现在都限时免费开放。

  不过我还是好奇,同一款模型凭什么能同时做到聪明、便宜、好用?这不得狠狠扒一扒。

  发布了什么?一次性上新两个 Agent 模型

  要搞懂昆仑万维 SkyClaw 系列模型为什么能打,得先理解一个很多人忽略的区别。

  现在市面上大多数模型的 Agent 能力,本质上是后天加的 buff——先训一个通用大模型,再套一层工具调用的壳。

  省事确实省事,但由于模型本身并不是按“完成任务”来训练的,而是按“生成语言”来训练的,所以简单任务还行,一复杂就容易掉链子。

  而 SkyClaw 走的是完全不同的路。从训练的第一天起,它的目标就不是聊天,而是干活。工具怎么调、参数怎么传、多步任务怎么拆解和执行,这些能力不是后天补课补出来的,是从“娘胎”里带的。

  这个起点上的差异,直接决定了后面的上限

  实际上,行业里已经有不少玩家意识到这个问题,开始从“通用模型+工具壳”转向专门为 Agent 场景设计的模型。

  而昆仑万维这次发布的 SkyClaw-v1.0 和 SkyClaw-v1.0-lite,正是这条新路线的产物。

  两款模型,一重一轻,各有分工。

  先说旗舰版 SkyClaw-v1.0,吃复杂任务的主力

  它针对 OpenClaw 相关任务做了深度优化,适用于企业级的多步骤、强工具依赖场景。

  在 Claw 相关任务上,据了解 SkyClaw-v1.0 已经可以和 Claude Opus 4.6 这个级别的闭源顶流模型正面过招。

  能和 Opus 4.6 相提并论,我实在忍不住先去官网翻了几个 demo,一看还真绷不住了。

  一眼扫过去,SkyClaw-v1.0 是真爱玩游戏(bushi,页面上全是它生成的各种“经典款”。

  随手打开水管工马里奥,结果我直接通过电脑键盘就这么玩起来了——

  前进、后退、跳高拿金币,全程丝滑不卡顿。

  觉得游戏只是炫技?再来一个正经干活的。

  看看这个金融终端的完成度,顶部滚全球指数,左边是频道导航,中间新闻流带着来源和关联股票,右边自选股带迷你K线图,连突发新闻弹窗都做了。

  这种多个模块联动的界面,以前前端团队至少搞好几天,而 SkyClaw-v1.0 很快就自己搞定了。

  当然,这些行情数据是模型自己模拟生成的,不是真实数据。

  但这反而是重点。SkyClaw-v1.0 干的活是从零搭架子——界面、组件、交互逻辑,一次性把代码给你写完。开发者只需要接上真实数据,就能让页面真正跑起来。

  从马里奥到金融终端,从娱乐到生产力,复杂度差了好几个量级,而 SkyClaw-v1.0 都能一口气吃下来。

  或许这就是传说中的,原生 Agent 模型和通用模型顺手做 Agent 之间的差距。

  再说轻量版 SkyClaw-v1.0-lite,Agent 核心能力没打折,但速度更快、价格更便宜

  它面向的是高频、成本敏感的场景,比如批量 API 调用、轻量级自动化流程。

  发现没,自从模型进入 Agent 时代后,大部分玩家在推主力模型时都会附带一个轻量版,这也很好理解,就像前段时间 Snapchat 前机器学习工程师说的那样:

如果你用 AI 开发时,始终默认使用成本最高的模型来完成每一项任务,那么你 80% 的工作都是在浪费钱。

  经常用 Agent 跑任务的人,估计都对此深表认同。

  有了这两个模型,一个负责性能天花板,一个负责守成本底线,是谁又被 AI 稳稳地接住了(doge)。

  不过说实话,这款模型更让我心动的,还是它的价格。

  SkyClaw-v1.0 输入 0.5 元/百万 tokens,输出 4 元/百万 tokens;轻量版输入仅 0.3 元,输出 2 元

  悄悄对比了一下,这个价格仅为主流顶尖模型的一半甚至更低。

  而且发布期还叠加了限时免费,对,你没看错,免费。

  更离谱的是后手——试用期结束后,昆仑万维计划逐步开源每个模型版本

  性能够到了闭源顶流,价格砍到了行业腰部,后面还有开源兜底。

  这套组合拳打完,我只想说一句:这是要把 Agent 模型的落地门槛狠狠打下来啊。

  怎么上手?就这么开箱即用

  到这里,本“既要又要党”已经心中大致有谱了,接下来只干一件事:

  自己跑一把,毕竟是骡子是马总得要拉出来遛遛。

  怎么试呢?总结起来目前有两条路:

  最快的方式,就是直接去天工 Skywork 平台(tiangong.cn)。SkyClaw-v1.0 已经在 5 月 22 日接入了天工 Skywork,不用装任何东西,不用配环境,浏览器打开就能用。

  而且现在正值限时特惠,价格超低,感觉很适合想先试试 Agent 能力再决定是否深度接入的人。

  想深度集成的,那就走 API(API 目前免费中)免费注册一个 APIFree 账号,拿到 API Key 就能调用,接口兼容 OpenAI 格式,支持流式输出、工具调用、多轮对话。对已经在用 OpenAI 接口的开发者来说,基本就是换个 baseURL 和 model 名的事。

  (P.S. APIFree 是昆仑万维自家的模型聚合平台,支持调用国内外多种主流模型。)

  话不多说,我这就选两个比较典型的 Agent 场景跑一跑。

  第一个我想试试给自己“养”一只电子桌宠,既能打工还能陪我摸鱼那种。需求大概是这样的:

  一只小猫,能在屏幕上随机溜达,点击会说打工人语录,右键能切工作模式和摸鱼模式,工作模式带番茄钟倒计时,还要有喝水提醒、远眺提醒、拉伸提醒这些健康功能。

  只见提完需求后,SkyClaw-v1.0 就直接在 Skywork 平台里开干了,等我刷完短视频回来,发现它已经把整套源代码文件全部生成完毕。

  再一看成品,小猫是 SVG 渐变绘制的,粉色身体、三角形耳朵、大眼睛,还挺可爱。

  右键打开 Focus Mode 面板,番茄钟支持 25/45/60 分钟三档,下面是任务清单和健康提醒模块。倒计时结束后小猫自动切到摸鱼模式,弹出气泡:我不是在摸鱼,我是在给公司省电……

  当然,为了快速看效果,我先让它生成了 HTML 版本,浏览器打开就能玩。如果想做成真正的原生桌宠,还可以继续让它生成 Electron 打包方案,终端跑几行命令就能变成常驻任务栏的桌面应用。

  而更让我惊喜的是,做完之后它主动弹出了一个 IM 连接面板,支持 Skywork App、飞书、Slack、Discord、Telegram 等七种聊天工具直连。

  也就是说,后续如果做进一步的开发对接,这只小猫理论上可以直接在我日常使用的聊天窗口里和我互动。

  好,摸鱼测完了,老规矩再来个正经的。

  我们编辑部每周都有例会,其中一项就是总结上周的 AI 趋势。

  为了避免会前还在抓耳挠腮,这次我打算弄一个AI 行业周报自动生成系统。需求很简单也很贪心:

  自动抓取过去一周的 AI 热点,按主题分类,提炼趋势信号,最后生成一份可交互的周报页面。

  结果你猜怎么着?这事儿还真让 SkyClaw-v1.0 干成了。

  前端就不用多说了,UI 和功能布局一目了然。

  关键是后端,看了 SkyClaw-v1.0 的工作过程才发现,它不光用 FastAPI 搭了一套完整 API,还自己整出了一条信息处理流水线。

  前面从 RSS、GitHub、HuggingFace、网页四个渠道自动抓数据,中间做清洗、分类和趋势分析,后面自动生成周报,最后用 SQLite 存起来。

  而我核心要的,就是那个周报 Tab 页——顶部三句话总结本周趋势,中间是一些值得关注的板块,最后是按分类展开的详细报告。

  我试了下,分类中的每条链接都可以打开并跳转,这说明数据是真实抓取的,不是模拟生成的。

  当然最让我心动的依旧是最后一步。做完之后,它提示我可以把这个系统设置为定时任务,比如每周一早晨自动运行抓取和分析脚本,生成最新一期周报。

  两个任务跑下来,一个感觉特别明显:SkyClaw-v1.0 已经不是那种需要你一步步喂指令的模型了。

  桌宠那个,从理解需求、写代码到打包,全自己搞定,甚至还主动推荐了 IM 直连的方式。

  周报那个更狠,直接给了一套完整的产品原型——后端、数据库、信息抓取、分析、前端面板全都有,理论上还能定时自动运行。

  而且有一个细节必须提一下,如今 Agent 时代都讲究可复用的工作流,SkyClaw-v1.0 这一点也做得很好,像上面那个周报系统,它就会弹窗提醒你要不要设置成 Skill

  从开发到复用,能看到昆仑万维已经有意在 Agent 模型中构建完整的工作流闭环。

  再叠加前面说的价格,说白了就一句:SkyClaw-v1.0 已经能用,而且真用得起了。

  怎么做到的?原生为 Agent 设计的训练范式

  至于 SkyClaw-v1.0 模型到底怎么做到的?

  昆仑万维这次也没藏着掖着,项目主页上直接清晰列出了几点理由:

  总结起来就是,不靠堆参数,靠针对 Agent 核心痛点进行系统性优化

  最典型的就是工具调用,现在很多模型聊天挺聪明,但一到真干活就开始掉链子——

  参数传错、步骤漏掉、格式写崩,一个失误后面全乱套。

  SkyClaw-v1.0 就想了,既然 Agent 天天要调工具,那干脆从训练阶段就把模型泡在 Agent 环境里

  于是它在 mid-training 阶段就塞进了大量复杂 Agent 任务,让模型从底层开始适应“调用工具”这件事,而不是后面再临时补课。后面再用针对 OpenClaw 任务的高质量数据继续强化,多步骤工具调用的稳定性一下就上来了。

  但 Agent 还有另一个经典问题:聊着聊着就“失忆”

  一说到记忆问题,很多人可能下意识认为“把上下文窗口做大就好了”。

  确实,SkyClaw-v1.0 也没落下这一点,直接把上下文拉到了前沿玩家的百万级水准。

  但重点其实不只是“窗口够大”,而是它在强化学习阶段直接扔进真实 Agent 环境里反复训练,让模型学会在超长任务链里稳住状态。

  说白了,不是实验室里刷 benchmark,而是真拿去干活练出来的。

  还有一点也挺关键。

  很多 Agent 模型在自己熟悉的框架里猛得不行,一换环境立刻拉胯

  于是 SkyClaw-v1.0 干脆在训练阶段就把 OpenClaw、Claude Code、Hermes、Nanobot 这些主流环境全覆盖了,相当于提前做了一遍“大规模适配”,开发者不用被某个框架绑死。

  当然,最关键、可能也是最容易被忽略的一点是:昆仑万维没把模型做成一个巨无霸

  过去想要顶级 Agent 能力,默认就得接受大参数、高成本、慢推理这套组合。而 SkyClaw-v1.0 换了个方向,不是把参数往上堆,而是把训练流程做成 Agent 专项特训,在更小的参数量上把能力顶上去。

  参数小了,推理自然快,成本自然低,这也是它价格能打到主流一半的底层逻辑。

  所以回头再看,真正拉开差距的,可能早就不只是参数规模了。

  一个模型从第一天开始,到底有没有围着 Agent 场景去训练,很多时候才决定了它最终能不能真正干活。

  起点不同,终点自然不同。

  Agent 落地的“不可能三角”,被国产玩家打破了

  老实说,SkyClaw-v1.0 系列模型的出现,刚好踩在一个很微妙的节点上。

  Agent 赛道喊了一整年,大家都知道这是方向,但真正能用、用得起、还好接入的模型,一直没几个。

  而它填补的,恰恰是高性能 Agent 能力与低成本落地之间长期空着的那块地。

  而且它还不是突然冒出来的。

  早在今年 2 月,昆仑万维就上线了 SkyClaw 产品,基于开源架构 OpenClaw 重构,做的是全天候云端 AI 助理。

  随后的 3 月,它又在 GitHub 和 Clawhub 铺了首批 6 个官方 Skill:PPT、文档、表格、设计、搜索、音乐,基本把办公场景的核心环节覆盖了。

  现在 SkyClaw-v1.0 一出,回头看这条线就很清楚了:

  先搭平台,再铺 Skill 生态,最后把底层模型的性能和成本一并解决。

  就像我在实测中感受到的那样,做完桌宠它问你要不要存成 Skill,做完周报它提醒你设成定时任务,昆仑万维瞄准的显然不只是一个模型,而是一整套 Agent 工作生态。

  这背后的逻辑其实也不难理解,因为一个显而易见的大趋势是——生产力正在从单一工具时代,迈向可持续运转的 AI 工作流时代。

  单个模型再强,如果没有平台承接、没有 Skill 沉淀、没有工作流串联,能力就是一次性的,而一次性显然不是这个时代大家所追求的。

  其实回看昆仑万维这几年做的事,有一条线挺清晰的:把 AI 技术尽可能带给更多人。

  先不说早期开源和价格下压那些大动作,你注意到一个产品细节没?

  天工 Skywork 上不只有自家模型,Claude、GPT 这些也能直接用;APIFree 更干脆,直接做成模型聚合平台,国内外主流模型一个账号全搞定。

  说实话,这种做法在行业头部玩家里的确不多见。毕竟大部分平台,本质上还是希望把用户圈在自己生态里。

  而这次 SkyClaw-v1.0,某种程度上走的也是同一条路。

  限时免费、价格直接压到主流一半、继续铺 Skill 和工作流生态,说到底都是在让 Agent 能力真正走出实验室。

  因为只有当价格开始降下来、工作流开始普及,顶级 Agent 能力才不会只是大厂内部才能长期“消费”的东西。

  从高端实验到全民落地,至少昆仑万维先给大家打开了一扇门。

  项目主页:

  https://skyworkai.github.io/skyclaw/

  模型介绍与完整评测数据:

  https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=info

  API 文档:

  https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api

  https://www.apifree.ai/model/skywork-ai/skyclaw-v1-lite?tab=api