
新智元报道
Claude 账号忘设上限,一月烧光近 5 亿美元!开发者每月花费从 29 美元变 750 美元,还有的从 50 美元一路狂飙到 3000 美元:你的 Token 账单还撑得住吗?
1 个月烧出 5 亿美元账单!
近日,科技圈曝出一桩惊天乌龙。据 Axios 报道,一家企业在短短 1 个月内,竟然在 Claude 上刷爆 5 亿美元!
原因令人哭笑不得:管理层在给员工开通 Claude 账号权限时,忘了设置使用额度上限。

其实,AI 账单爆仓的远不止这一家。
今年 4 月,一名谷歌云用户因公开服务中遗留的 API key 被滥用,原本只有 7 美元预算的账户,一夜之间收到了 1.8 万美元的账单。

这个倒霉用户名叫 Jesse Davies,是一名澳大利亚 AI 顾问、Agentic Labs 创始人。他给自己的 Google Cloud 账户设了两道保险:一个 10 澳元(约 7 美元)的预算预警,一个 1400 美元的硬性消费上限。
据 Tom's Hardware 报道,攻击者发现了他几个月前从 AI Studio 发布的一个 Cloud Run 服务,发了 6 万多个请求,两道保险都没拦住:账单计算有延迟,等系统反应过来,金额已经飙到了 1.8 万美元。
5 月中旬,开源项目 OpenClaw 的创始人 Peter Steinberger 在X上贴出一张截图:30 天,OpenAI API 账单 130 万美元。

他的团队只有三个人,但他们指挥的 100 个 Codex 智能体在并行跑:30 天烧掉 6030 亿个 Token、跑出 760 万次请求。还好,这 130 万美元并非他自掏腰包。
Steinberger 今年 2 月加入了 OpenAI,这 130 万美元被当作一次内部实验:测试如果不考虑 Token 成本,AI 编程能跑到什么极限。他补充道,这是 Codex「Fast Mode」(高速档计费)的结果,关掉之后大约 30 万美元。
更早一些,Uber 的 CTO Praveen Neppalli Naga 也曾向 The Information 承认,公司 4 月份就把全年的 Claude Code 预算烧光了,他们的 COO 也公开表示,AI 成本越来越「难以自圆其说」。
5 亿、130 万、1.8 万,金额虽然差出几个数量级,却指向同一个事实:
在智能体时代,失控的密钥、昼夜无休的智能体军团、忘了设上限的账号:任何一个,都能让你的 Token 账单一夜刷爆。
AI 账单为什么会爆仓?
答案主要藏在计费方式的变化里。
从今年 4 月起,OpenAI 的包月计费方式开始转向按 Token 用量计费。
4 月 2 日,Codex 计费从按消息估算改成按 Token 用量对齐:输入、缓存输入、输出三类 Token 分开算。4 月 23 日,这套规则扩展到所有 Enterprise、Edu、Health、Gov 方案:月费里那笔看不见的折扣被抽掉了。
GitHub 也紧随其后,刚刚官宣:所有 Copilot 套餐从 2026 年 6 月 1 日起,转向按用量计费。旧的高级请求逻辑作废,换成 AI 额度,按输入 Token、输出 Token、缓存 Token 的实际消耗,对照每个模型的 API 费率结算。

GitHub 官方解释了这么做的原因:
现在一个快速的聊天提问,和一次跑好几小时的自主编码任务,用户花的钱一样多。GitHub 一直在替那些跑重度任务的用户买单,但这套模式已经不可持续。
AI 智能体崛起之前,聊天和补全成本差不多,月费兜得住。
智能体崛起之后,一次任务能连续跑几小时、改动整个代码库,重度用户和轻度用户的成本差可以拉到几个数量级。月费制在这种差距面前,直接崩了。
消息一出,Reddit 和X上一片哗然。
一位 ID 为 JBusu 的开发者晒出了账单截图,直言新定价「就是个笑话」。原本 28.12 美元/月的开销,按新制要付 746.01 美元,他已决定退订,「这个价格,我自己租云服务器都还便宜」。


另一名用户截图更夸张,费用从 50 美元一路狂飙到 3000 美元,他说没想到定价这样离谱,「还有人继续订阅吗?」

不过也有 Copilot 老用户出来反驳:这些极端账单多半是 vibe-coder(凭感觉编码者)们不把烧 Token 当回事给烧出来的,未必能代表正常使用。
一位老用户在评论区留言:「我整天都在用,月底基本不超额,很难相信这是工作复杂度的差异。」另一位则更直接:「就是有人要全自动的 YOLO 模式开发,让 AI 随便跑。这种浪费被剔除,对其他人反而是好事。」
有一点必须清楚:GitHub 没有废除月费,基础订阅价格并没有变。真正变的是额外用量、智能体任务、更贵的模型调用,从此进入用量计费。
被冲击最大的,是那些靠 Copilot 跑长链任务的重度智能体用户。
被自己人玩坏的排行榜
月费失守,一面是平台改了计费规则,另一面是用 AI 的人,自己也在拼命烧。
5 月,Business Insider 报道,Amazon 下线了一个名叫 KiroRank 的内部 AI 使用排行榜。
该报道援引知情人士的话称,这个榜单悄悄催生了一种奇怪的工作方式:部分员工为了在榜单上多爬几位,会去刷一些并不解决实际问题的 Token 消耗,纯粹为了排名。

事情曝出之后,Amazon 高级副总裁 Dave Treadwell 直接向全员喊话:「别为了用 AI 而用 AI。用它去解决客户问题,解决业务问题,去创新。」
这事虽然有点荒唐,但毫不意外。当「烧 Token」能上榜,员工自然就会去烧 Token。
硅谷给这种现象起了个专门的名字:Tokenmaxxing(极限烧 Token),把消耗量当生产力。
Axios 的报道里也提到,有 CTO 发现员工拿 AI 模型查天气、写日常邮件,简单到不行的事,套上最贵的前沿模型,账单就能悄无声息地飞涨。
KiroRank 并非 Amazon 官方考核体系,而是员工自发搭的非正式工具。但它清楚地暴露了一个经典的管理学规律:当 KPI 设错的时候,人就会用最聪明的方式钻空子。
把「用了多少」等同于「干得好不好」——这正是这一轮 AI 浪费的制度性根源。
算 Token 账的人,已经在赚钱
Token 账单焦虑的另一面,有人悄悄把它做成了生意。
第一条路:用上下文喂饱 AI。
Glean 正是 Arvind 自家公司。它做的就是企业 AI 工作助手:把分散在公司各处的知识统一打通,让员工的 AI 直接拿到上下文,不必再四处翻箱倒柜。AI 少绕路,烧的 Token 自然就少。
这套机制让 Glean 的年度营收 15 个月翻三倍,跨过 3 亿美元,客户包括 Databricks、Reddit、Samsung。
第二条路:把活分给对的模型。
模型路由初创公司 Factory AI 干的就是这件事:自动把每个任务派给最合适的模型,简单任务走便宜档,复杂任务走顶配。Arvind 也讲过:路由做对了,能省 10 倍。
这两条路殊途同归:让 AI 干活,但别让它乱烧。
学术圈的研究,也在为这种转向奠基。

https://arxiv.org/pdf/2604.22750
2026 年 4 月的一篇 arXiv 论文,第一次系统拆解了智能体编码任务到底怎么烧钱。
结论一:智能体任务的 Token 消耗,可达普通代码推理和代码对话的上千倍,推高成本的主因是输入 Token。
结论二:同一个任务跑多次,Token 消耗能差出 30 倍。
结论三:更高的 Token 消耗,并不必然带来更高准确率。精度往往在中等成本处见顶——再往上烧,钱花了,效果反而饱和。
论文还发现,前沿模型连预测自己要烧多少 Token 都做不到,普遍低估真实成本。
你以为多花钱就能多办事。实际是钱花了,活不一定更好,预算还算不准。
当 AI 账单开始赶超人力成本
「这是我记忆中第一次,技术成本开始和人力成本持平。」
5 月 29 日,Glean CEO Arvind Jain 在接受 CNBC 记者 Deirdre Bosa 采访时这样讲道。

英伟达应用深度学习副总裁 Bryan Catanzaro 的观察也印证了这一点。
他在 Axios 访谈里提到:对于他的团队来说,算力成本已经远远超过员工薪资。
类似的现象正在多家公司浮现:从做企业 AI 的 Glean,到卖 AI 算力的英伟达,再到用 AI 的 Uber,都在重新审视这笔账。
在 Arvind 看来,历史上技术只是企业整体成本里很小的一块,但现在 AI 成本已经能追平工资单了,很多企业的年度 AI 预算通常都是一到两个月就烧光。

过去一年,AI 使用率是被崇拜的指标:多用就是先进,烧 Token 就是拥抱未来。现在,许多企业开始反思那句朴素的话:这些烧掉的 Token,到底换来了什么?
免费包月畅用的窗口期,恰恰正在此时关上。
接下来,摆在所有开发者面前的是这样一个问题:如何精打细算,让每一个 Token 发挥出最大价值。
未来真正的赢家,毫无疑问将是最先学会算 Token 账的那个。
参考资料:
https://x.com/dee_bosa/status/2060791500049613306%20
https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20
https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20
https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5
编辑:元宇
