
编辑|泽南、杜伟
每天 120 万亿 Tokens,这就是今天上午火山引擎 AI 创新巡展上,豆包大模型亮出的最新成绩单。

凭借这一惊人的消耗量,火山引擎已经跃升为中国第一、全球第三的大模型服务商,其 Token 调用量可谓占据了国内 AI 云的半壁江山。
事实上,自 2024 年 5 月首次对外发布以来,火山引擎是行业内唯一一家持续公布 Token 调用量的 AI 云厂商。短短两年内,其调用量上涨了 1000 倍,与 AI 爆发的趋势完美重合,也宣告了以 Token 计费为基础的 MaaS 商业模式正在全面爆发。

目前,在火山引擎上累计 Tokens 使用量超过一万亿的企业,已从去年底的 100 家增长到 140 家。
Token 调用量之所以出现指数级的激增,原因并非大家与 AI 的聊天变多了,而是底层的应用形态发生了质变。吞吐海量数据的视频生成大模型,以及需要反复拆解任务、调用长工具链的 AI 智能体,都在快速拉升算力消耗。
火山引擎总裁谭待表示,Token 使用量已经成为了衡量 AI 发展速度的核心指标,近期豆包大模型使用量高速增长背后,主要原因是 AI 视频创作爆发、AI 智能助理(Agent)加速普及,其中备受关注的「龙虾」类智能体需求增长尤为突出。
在这次活动上,字节的两大明星 AI 产品 Seedance 2.0 与 ArkClaw 都亮出了最新进展。

火山引擎总裁谭待
Seedance 2.0
终于公测了
要理解海量 Token 是怎么被消耗的,首先需要把目光投向多模态。
随着视频模型 Seedance 2 的爆火,多模态已经取代纯文本,成为 Token 消耗的主力。
有了 Seedance 2.0,AI 在多模态理解上已经迈入了全球顶尖水平,能够打通文本、图像与视频之间的语义关联,处理更复杂的组合输入,并给出更一致的生成结果。

火山引擎大模型解决方案负责人张天劼
对于物理规律的理解和运用更加成熟,无论是物体运动、交互关系,还是因果与时序逻辑,都呈现出更接近现实世界的稳定表现。

同时,面对复杂指令,Seedance 2.0 也展现出更高的执行精度,能够准确解析多层约束与细粒度要求,将抽象描述转化为结构清晰、细节一致的生成结果。

可见 Seedance 2.0 在画面稳定性和物理规律理解上,能力又有了肉眼可见的跃升。基于此,创作者们可以把过去存在于脑海里的想象转化成为影像。
能力的提升正在直接转化为生产力。字节表示,在漫剧工作中,内测的制作公司每分钟成本已被降低到 4000-5000 元,能力投入从过去的 20 人 / 天降低到 3 人 / 天,成本降低了近 10 倍。
在今天的发布会上,火山引擎正式宣布:Seedance 2.0 面向企业用户开放公测

我们知道,Seedance 2.0 作为中国第一个 SOTA 模型,早在春节前就已火遍全球,但一直处于邀请内测状态。火山引擎表示,之所以延迟到如今才开启公测,是因为需要构建稳定的安全机制。
作为当前视频生成领域的全球 SOTA 模型,Seedance 2.0 现在建立了领先的工业级版权与肖像安全保障。这套体系严密覆盖了视频生成涉及的各种输入模态,以及创作前、中、后的全流程。它能最大限度地避免侵权、Deepfake(深度伪造)等恶性行为带来的负面影响,让创作者和企业免除后顾之忧。
在 C 端大众市场,大模型生成的视频如果有瑕疵或越界,偶尔还会被人们认为是有趣。但在企业级市场,游戏的规则完全不同。无论是广电媒体、电影厂牌,还是大型品牌方,要将视频大模型接入自身的商业生产流,内容安全、版权合规、数据隐私与输出可控是不可逾越的红线。
字节此次打磨的这套苛刻标准,针对输入参考内容中的音频、视频、IP 等元素进行了全方位考量,通过快速比对,在最大限度上保证了 AI 生成内容的原创与合规。
可以说,补齐了这套安全标准与管控流程的 Seedance 2.0,才算真正把 AI 视频生成拉到了工业级生产力的水准。这或许正是 OpenAI 当初在 Sora 上想做而迟迟做不到、颠覆视频生成产业所必需的那张「准入牌照」。
从「能生成」到「在多个行业中具备规模化生产内容的能力」,这正是如今 Seedance 2.0 能够长久不衰的核心竞争力。

ArkClaw 与「养虾」三要素
让智能体走向流水线
如果说视频大模型拓宽了 Token 消耗的「深度」,那么全面爆发的 AI 智能体,则拉长了模型调用的工具链,增加了 Token 消耗的「广度」。
最近,科技圈简直就像是捅了龙虾窝,各种带 Claw 结尾的智能体让人眼花缭乱。在这其中,火山引擎推出的智能体服务 ArkClaw 究竟进展如何?

它是一个开箱即用的「云养虾」方案,解决了人们部署 OpenClaw 时最头疼的配置、安全和费用焦虑。ArkClaw 可以秒级配对飞书,在微信、钉钉、微博等消息渠道的也能便捷配置。最近升级的网盘功能,又提供高效的端云协同存储空间。
基于 ArkClaw 的实践,谭待进一步指出,企业用好「龙虾」的三个关键要素包括模型、技能与安全

首先是作为龙虾大脑的模型,它决定了智能体能力的上限,今年 2 月,豆包大模型 2.0 系列发布,全面升级多模态理解、LLM 及 Agent 能力,视觉理解能力在权威评测榜单中跻身全球第一梯队,居国内第一。豆包 2.0 能够在复杂指令下依然保持精准、稳定,这是 AI 能够胜任企业级核心任务的根本保障。
其次是下场干活的工具:Skills。智能体能发挥多大价值,其背后需要由 Skills 生态来提供支撑,而繁荣的智能体生态需要开放协作。
今天,OpenClaw 创始人 Peter Steinberger 还和火山引擎共同宣布,双方共建的 ClawHub 中国官方镜像站正式启动运营。它能为国内开发者提供稳定、高速的技能资源与服务,不仅大幅降低了本地化部署的门槛,也让开发者们能够更便捷地链接并共享全球顶尖的技术生态。

ClawHub 中国官方镜像站地址:mirror-cn.clawhub.com

Peter Steinberger 通过「龙虾」生成的视频,宣布 ClawHub 中国镜像站启动。
文中视频链接:https://mp.weixin.qq.com/s/iD17YvAYUMvSkAUsSUzFpw
再往下是智能体运行的基础和底线:安全。最近随着 OpenClaw 的使用量暴增,沙箱与权限失控、提示词注入、Skills 插件投毒等安全问题不断出现。对此,ArkClaw 针对智能体权限管理和 Skills 全流程安全防护做了全面升级。

火山引擎云基础产品负责人田涛涛
在信通院有关「龙虾」类产品的「智能助理智能体产品可信能力认证」和「安全防护产品有效性认证」两个权威安全测评上,火山引擎成为了国内首家、也是唯一一家同时斩获这两项认证的厂商,既能在平台层实现供应链、权限、数据的全流程可信管控,也能在攻击层有效应对提示词注入、恶意插件等真实威胁。

未来,ArkClaw 将从五个方向持续演进:强化开箱即用的 Claw Ready 能力,降低使用门槛;按需创建不同模板,提升能力复用效率;增强定时任务等主动执行能力,从响应走向执行;引入多角色、多实例的 Claw Team 模式以及进一步开放第三方模型接入。
正如田涛涛所说的,「ArkClaw 的目标是让每个人拥有一个真正可用的 AI 助手。」

从「敏态」到「稳态」
智能体的商业闭环
明确了模型、技能与安全的「三要素」后,企业到底该如何将智能体融入实际的业务中?
谭待指出,OpenClaw 带来的变革固然巨大,但企业此前在智能体建设和工作流上投入的资源并不需要推倒重来。面向未来,火山引擎给出的建设方案是:沿着「敏态」与「稳态」两条路径双轨并行
一类是充当「创新试验场」的敏态智能体。这类智能体强调的是「探索」,核心在于解放个人生产力。在实际工作中,宝贵的行业经验往往只存在于优秀员工的脑子里。以 ArkClaw 为代表的数字助理产品,就是为了让个体员工能够灵活、敏捷地把自己的隐性知识具象化为得心应手的智能体工具。
另一类是充当「数字化流水线」的稳态智能体。当企业在敏态探索中找到了某种 AI 最佳实践后,就需要将其流程化、规模化,以解决组织生产力的问题。特别是在合同审核、生产交易等「绝对不能出错」的核心场景中,重点在于降低模型幻觉、确保高并发与绝对的稳定性。针对这类需求,火山引擎推出了 HiAgent,为稳态 Agent 提供开发、运营、管理的一站式服务。
敏态与稳态并非割裂,而是共同咬合成了推动企业 AI 转型的进化飞轮,在这其中,AI 才真正成为了能够自我生长的企业核心数字资产。
Harness 时代来临
AI 拐点已至
今年 2 月,专为通用智能体构建的 Kimi K 2.5 发布后,月之暗面 20 天内累计收入超过了 2025 年全年的总收入。前天智谱 AI 在财报上说,其 API 平台的 Token 价格年初至今已上涨 83%,然而需求仍在持续加速。
在上周的中国发展高层论坛 2026 年年会上,我们更是看到了一组与 Token 相关的重要数字:截至今年 3 月,我国日均 Token 的调用量已突破 140 万亿。相比 2024 年初的 1000 亿,两年内暴增了 1000 多倍。
现在,Token 已经不仅仅是 AI 底层的处理单位,更是智能时代可计量、可定价、可交易的「结算单位」。
当「小龙虾」满地跑,Token 成为衡量新质生产力和云计算营收的重要数据,大模型厂商的角逐已经彻底翻篇。火山引擎的这场发布会,向全行业释放了一个强烈的信号:
单纯「卷参数」的模型训练时代即将结束,AI 行业正在全面迈入 Harness(系统编排工程)时代
未来的竞争壁垒,不再仅仅是谁的基座模型更聪明,而是谁能将强大的模型与复杂的现实环境、海量的第三方 Skill 以及严苛的安全管控流程,编排结合得更完整顺畅。
而当智能服务场景被 ArkClaw 这样的产品彻底解锁后,企业和用户是会基于 AI 的生产力,实现能力的提升。
跳动的 Token 背后,一个难以估量的新时代正在来临。
