多收170万!AI账单黑箱曝光,Anthropic退钱不认账

  新智元报道

  AI 能提效不假,但账单却越来越看不懂了。

  一位名叫 Michael Hahn 前 Oracle 总监,最近干起了一门打假 AI 账单的生意。

  他的公司 Vaudit 翻了 60 家企业、约 3400 万美元的 AI 账单,大头是 Claude Code 的使用费,从里面揪出约 170 万美元的多收费用。

  The Information 报道:审计公司 Vaudit 称,在其经手的企业 AI 账单中查出约 170 万美元疑似多收,主要涉及 Claude Code。

  被审计的客户名单中不乏松下、HP、本田这样的企业。

  可你要是去问账单另一头那两位 AI 巨头,得到的回答是另一个版本。

  Anthropic 说,自己不为没完成的请求或报错计费,也不会把请求偷偷路由到旧模型,超额这事看起来不像是普遍现象。

  OpenAI 更干脆:没有证据显示这些问题发生在自家客户身上。

  两边都说没问题。

  但经过 Vaudit 和客户一轮轮申诉,这些争议金额里,约 80% 最后被 Amazon、Google、Microsoft、Anthropic 和 OpenAI 退了回来。

  Hahn 说这些公司在出问题时配合度非常高,同意退钱,却不同意认错。

  于是情形就奇怪起来:审计公司拿着账本说「我查出来了」,约 80% 的超额费用也被退还了,模型厂商集体摆手说「没这回事」。

  既然都说没错,这钱,是怎么退出来的?

  这 170 万

  是怎么「多」出来的?

  先看 Vaudit 都翻出来了哪些东西。

  Michael 给出了三种最常见的多收方式,每一种都藏在账单不起眼的角落,平时根本不会有人逐笔去对。

  第一种,模型张冠李戴。

  客户实际调用的是更旧、更便宜的模型,账单却按更新、更贵的那一档来算。

  打个比方,你买的是经济舱的座位,结账时收的是头等舱的价。一次两次看不出来,跑上几百万次调用,差价就出来了。

  第二种,为失败买单。

  智能体或聊天机器人没完成请求、甚至直接报了错,这部分照样进了账单。

  第三种最隐蔽,Hahn 管它叫重试风暴(retry storm)。一个智能体任务失败了,它不声不响地自己反复重试,用户根本不知道后台在烧钱,费用就这么一层层叠上去。

  这三种里没有一种是用户「主动多用」造成的。

  最让人恐怖的是第三种。

  过去你用软件,是一步一点、自己盯着的,一旦跑飞了立刻就能掐断。

  可 AI 智能体的卖点恰恰是「放手让它自己干」,人退到了流程之外。

  这意味着当 AI 智能体在后台撞墙、重试、再撞墙,狂烧 token 时,那个原本会喊停的人根本不知道,而账单却要等到月底才送到你面前。

  Anthropic、OpenAI

  我们没乱收费

  这件事的重点,不是「谁骗了谁」。

  Vaudit 查到了,但 Anthropic、OpenAI 没认,这本就是审计公司的口径,谁也不能凭一句「查出 170 万」,就给两家公司扣上乱收费的帽子。

  但退款这一步,每一家倒也配合。能一口气退掉八成,恰恰说明这八成本就不该收。

  退款是纠错,钱退了,账还是笔糊涂账。

  之所以会出现这种「退钱不认账」的僵局,根子在 AI 计费这门生意本身的算法上。

  AI 账单为什么天生看不懂

  问题可能不在「算错」,而在「天生算不清」。

  因为它按 token 用量计费,你用得多就付得多,用得复杂就付得更多,可 token 在你常用的那些基础设施仪表盘里,基本是隐形的。

  更麻烦的是,它还会剧烈波动。同样问一句话,用哪个模型、prompt 怎么写、智能体怎么编排,烧掉的 token 能差出好几个量级。

  模型越往「智能体化(agentic)」走,越吃 token。一个智能体替你跑一个任务,背后可能是几十上百次模型调用,每一次都在烧钱。

  天生难预测、难解释,「多收」的模糊地带就是这么留出来的。

  Hahn 的话一针见血:AI 账单,正变得越来越不透明。这句话刚好戳中了整个行业的软肋。

  AI 从最早的「按调用计费」,一路走到今天的「多模型+多智能体+云中转」,账单的链条被拉得越来越长:模型厂商收一道,云厂商收一道,中间夹着的 SDK 代理再绕一道。

  每一道单看都合理,可三道叠在一起,很难一眼看清这笔钱究竟花在了哪。

  更要命的是,钱往往不烧在你看得见的地方。

  真正吃账单的那些场景,几乎都藏在后台,而且每一种都有公开的 GitHub issue 或事故报告可查。

  看完这八种,你会发现,要么是上下文一遍遍重传,要么是子智能体趁没人盯着通宵空转,账单就在你看不见的地方,自己越滚越大。

  200 美元的订阅

  5 万美元的账单

  Anthropic 遭遇 AI 账单的挑战,不止一次。

  就在 6 月 15 日,一位华盛顿特区的客户 Karl Kahn,把 Anthropic 告上了联邦法院,指控它在高价订阅上「货不对板」。

  据《华尔街日报》报道,Anthropic 的 Max 5x 每月 100 美元,Max 20x 每月 200 美元,宣传时的卖点,是 Pro 计划用量上限的 5 倍和 20 倍。

  可 Kahn 说,实际能用的量远远低于宣传。

  他今年 4 月升级到 Max 20x,结果几周内就撞上了每周用量的天花板,一次 5 小时的冲刺,就直接烧掉了 15% 的周额度。

  要么停工,要么省着用,要么再掏钱加购,他被逼到只剩这三条路。

  这桩诉讼的依据,主要是 Anthropic 在 2025 年 7 月发给不同档位订阅者的一批邮件,里面写明了各档每周大致能用多少量。

  原告正是拿这批白纸黑字,去对比实际到手的额度,得出了「远低于宣传」的结论。

  诉讼请求集体诉讼地位,覆盖 2025 年 4 月以来所有购买过这两档套餐的人。

  为 AI 账单挑错

  正在成为一门生意

  为 AI 账单「打假」的 Vaudit,成立于 2023 年,团队大约 30 人。

  创始人 Hahn 是 Oracle 前总监,老本行是物流、运输、广告和云服务的账单审计,说白了,就是个专门帮人「查账省钱」的。

  今年早些时候,他把这套手艺原封不动搬到了 AI 账单上。

  Vaudit 官网写道对你的每一笔 AI 支出进行监控并追回支出,目前已累计审计金额超过 10 亿美元。

  Vaudit 的玩法简单粗暴:

  客户把一段软件装进自己的 AI 环境,通常通过软件开发工具包(SDK)接入,悄悄捕获 AI 使用的原始数据,再拿去跟发票、账单逐条比对。对不上,Vaudit 就替客户去申诉。

  收费方式也直接:审计金额抽1%,追回来的钱再分 30%。它帮你追回得越多,自己赚得越多。

  专门给 AI 账单挑错,居然能做成一门生意。这件事本身就说明:AI 计费已经复杂到非请「第三方查账」不可的地步。

  而这一切,恰好踩在一个微妙的时间点上。

  Anthropic 和 OpenAI 都在为 IPO 冲刺,抢着把新功能塞给客户。一边是估值和营收的狂奔,一边是付费用户对着看不懂的账单皱眉。

  于是一个全新的行当应运而生:AI 时代的「账单税务师」。

  而你手里那张 AI 账单,又有谁替你算过?

  参考资料:

  https://www.theinformation.com/newsletters/applied-ai/anthropic-customers-find-errant-charges-auditing-startup-says?rc=epv9gi

  编辑:元宇