国思软件 - GPT-5.5翻倍，Gemini涨3倍：这波涨价游戏还能玩多久？

　　新智元报道

　　Epoch AI 最新测算揭开一个残酷现实：把全球所有 Blackwell 芯片拉满，也喂不饱 Token 洪流。

　　前沿大模型的涨价游戏，还能玩多久？

　　今年 1 月至今，GPU 租赁价格上涨超过两倍。

　　根据 Counterpoint 2 月发布的《内存价格追踪报告》，2026 年第一季度至今，内存价格环比上涨 80%-90%，创下前所未有的大幅飙升。

　　这种价格上涨，自然传递到了下游。

　　Epoch AI 刚刚发布的《梯度更新》报告，做了一件简单粗暴的事：把全球所有 Blackwell 芯片能处理的 Token 数量算出来，再和实际需求一比。

　　结论只有一个字——不够。

　　Token 洪流吞没一切

　　先看供给侧。

　　Epoch AI 的模型以 Kimi K2.6 为基准——万亿参数、320 亿活跃参数的 MoE 架构。

　　在 8000:1000 的输入输出比下，全球 Blackwell 集群的理论极限是每秒约 200 亿输出 Token。

　　听起来很多？换算一下：够地球上每个人每月用 700 万 Token。

　　但这是理想情况。一旦上下文窗口拉长到 128k，吞吐量直接暴跌 50 倍，降到每秒约 5 亿 Token。

　　再看需求侧。

　　Google 刚刚披露，自家每秒处理约 12 亿 Token（输入+输出）。

　　按 8k:1k 请求比例换算，每秒输出 Token 约 1.3 亿。Exponential View 估算，Google 大约占全球 Token 需求的 25%。

　　这意味着当前全球 Token 需求，用 Blackwell 全产能、全给昂贵的万亿参数模型去跑，勉强能撑住。

　　但需求在以什么速度增长？

　　每年 10 倍。

　　自 2024 年以来，Google 处理的 Token 量年增 10 倍，其他供应商的增速也差不多。

　　而供给侧呢？全球 AI 算力年增 3.4 倍，芯片内存带宽年增 4.1 倍。

　　供给 3.4 倍 vs 需求 10 倍。差距每年都在撕裂。

　　Meta 员工一天烧 100 万 Token

　　算力紧缺不是抽象数字。

　　看看企业内部在发生什么。

　　The Information 报道，Meta 的 8.5 万名员工每月消耗60 万亿 Token。

　　换算下来，每位员工每天烧掉约 100 万输出 Token。

　　Apple 更猛。

　　部分工程团队被允许每天在 Token 上花费 300 美元——按 Kimi K2.6 的价格算，够一个人一天生成 2500 万输出 Token。

　　这还只是两家公司。

　　全球约有 1400 万软件工程师每天在用 AI。

　　如果他们的使用强度达到 Meta 或 Apple 员工的水平，全球 Token 吞吐需求将飙升至每秒 2 亿到 40 亿 Token。

　　40 亿。

　　而 Blackwell 长上下文的极限是 5 亿。差了整整一个数量级。

　　Claude Code 让开发者慢了 19%

　　更尴尬的事情也在发生。

　　METR 的最新研究显示，Claude Code 在实测中让资深开发者的完成速度慢了 19%。

　　VS Code 相关插件的安装增速自年初以来明显趋平。

　　编码工具的增长放缓，背后可能是两个原因叠加：一是算力资源本身在吃紧，二是很多企业已经烧完了全年的 AI 预算。

　　与此形成鲜明对比的是，前沿模型还在涨价。

　　ChatGPT Pro 订阅价格上调，Claude 的 API 价格水涨船高，Gemini 的涨幅最凶——部分场景下价格暴涨 3 倍。GPT-5.5 的定价更是直接翻倍。

　　用得更多，花得更贵，效果却未必更好。

　　企业的算盘很快就打清楚了。

　　逃向 DeepSeek

　　一条逃跑路线已经成型。

　　DeepSeek V3 的训练成本仅为前沿模型的1/10 到1/20，API 价格低至同类的1/16。

　　性能呢？直逼 GPT-5。

　　Hacker News 上一个帖子火了：一套 11 个月 ROI 模型，手把手教企业算清楚——从 GPT-5.5 切到 DeepSeek，每年能省多少钱。

　　评论区的共识很简单：前沿模型的定价权正在崩塌。

　　当一个开源模型能用1/16 的价格跑出 90% 的效果，涨价就不再是信心的体现，而是客户流失的加速器。

　　Tokenmaxxing——企业疯狂堆 Token 用量来榨取 AI 价值——本来是前沿模型的增长叙事。

　　但现在，The Information 的报道显示，这种策略正在反噬 AI 公司自身的利润边际。

　　用户越多，亏得越多。涨价止血，用户就跑。

　　经典的死亡螺旋。

　　算力悬崖前的决赛格局

　　把视角拉远一点。

　　前沿实验室——OpenAI、Anthropic、Google DeepMind——仅占全球 AI 算力的 20%-30%。

　　剩下的 70%-80% 在企业自用、云服务商、推理服务商手里。

　　这意味着，即便是最顶尖的实验室，也无法靠自建算力解决供需缺口。它们和所有人一样，在抢同一批芯片。

　　算力每年增 3.4 倍，需求每年增 10 倍。这个剪刀差不会自动消失。

　　更小的模型确实在替代部分需求——蒸馏层的崛起证明了这一点。但能力提升又在不断制造新需求。

　　AI 行业正站在一个悬崖边上。

　　不是技术的悬崖，模型还在变强。是经济的悬崖，算不过来账了。

　　当 GPU 租金翻倍、API 价格暴涨、开源替代品性能逼近、编码工具的 ROI 被质疑，一个核心问题浮出水面：

　　前沿模型的护城河，到底是智能，还是算力？

　　如果答案是算力，那么谁控制芯片，谁就控制 AI 的未来。如果答案是智能，那么 DeepSeek 用1/16 的价格逼近同等效果，已经在动摇这个答案。

　　参考资料：

　　https://counterpointresearch.com/en/insights/Memory-Prices-Surge-Up-to-90-From-Q4-2025

　　https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/https://news.ycombinator.com/item?id=48278610

　　编辑：大卫

GPT-5.5翻倍，Gemini涨3倍：这波涨价游戏还能玩多久？

我们的产品

相关链接

关于我们

联系我们