
新智元报道
马斯克深夜官宣:1.5 万亿参数 Grok V9 训练完成,现役三倍!更狠的是,训练数据直接灌入大量 Cursor 编程交互记录。
马斯克的编程三板斧,一口气全亮了!
就在 5 月 25 日凌晨,马斯克在上亲自官宣:
1. 5 万亿参数的 Grok 基座模型 V9-Medium 训练完成,是现役模型的整整三倍,2 到 3 周后面向公众发布。

几乎同一时间,更劲爆的细节浮出水面——
训练过程中,xAI 往模型里灌入了大量 Cursor 编程数据。
对此,老马直接放话,Grok 的编程能力将得到大幅提升。

再加上 600 亿锁定 Cursor、Grok Build 编程 Agent 上线,马斯克围绕编程赛道的布局,已经全面摊牌。
1. 5 万亿参数,Grok 5 要来了
V9-Medium 是 xAI 内部版本代号,对应的产品名几乎可以确定就是「Grok 5」。
参数规模 1.5 万亿,现役 v8-small(5000 亿参数)的整整三倍,并且针对英伟达 Blackwell 架构 GPU 进行了专项优化。

对于现在的 Grok,就连马斯克本人都嫌弃得不行——「垃圾太多了」。
V9-Medium 要还的,就是这笔债。
而还债的核心手段,就藏在帖子里那句「大量 Cursor 数据」。
偷师 Cursor:拿着答案卷复习考试
Cursor 的分量不用多说。
超过 67% 的财富 500 强企业在用,2026 年底预计年化收入突破 60 亿美元。
老黄公开表示,Cursor 是他最喜欢的企业级 AI 服务。
用 Cursor 数据训练 Grok V9,就相当于拿着答案卷复习考试。
只不过这场考试考的是写代码,而答案卷就是工程师们实际写代码的方式。
某种意义上这既算作弊,又恰恰是正解。

这背后的原因在于,如今LLM 的瓶颈不是写基本语法,而是理解复杂工程逻辑、多文件代码库和真实的调试工作流。
而 Cursor 有着大量来自真实开发者与 AI 协同编程的完整交互记录——prompt 设计、代码修改、bug 调试、多文件协作。
因此,恰好能补上这个缺口。

网友 Peter Kuhar 干脆直接问 Grok 本尊「Cursor 数据到底包含什么」,Grok 还真答了——
高质量的真实编程交互,包括开发者的 prompt、代码上下文、编辑操作和任务完成记录。

值得一提的是,除了 V9 的发布外,此前的 v8-small(0.5T)模型将在年底前开源。

编程全家桶,齐了
回看这段时间的操作不难发现,马斯克在编程赛道上的布局是一套三连击。
第一步,600 亿美元锁定 Cursor。
4 月 21 日,SpaceX 宣布与 Cursor 达成协议,拿到了以 600 亿美元收购 Cursor 的期权。如果年底前不行使,支付 100 亿美元合作费。
SpaceX 在声明中表示:「SpaceXAI 与 Cursor 正在紧密合作,打造全球最好的编程和知识工作 AI。」
600 亿锁定一家编程工具公司,马斯克对 AI 编程这条赛道有多看重,不用多说了。
第二步,Cursor 数据直接灌进模型。
公开代码能训出基本功,但 Cursor 的私域编程交互数据,才是打造编程「尖子生」的核心燃料。
第三步,Grok Build 编程 Agent 正式上线。
5 月 14 日,xAI 发布了 Grok Build——
终端级 AI 编程 Agent,命令行运行,支持代码生成、文件编辑、依赖管理、shell 命令执行。
最大卖点是最多8 个子 Agent 并行工作。
定价是 SuperGrok Heavy 订阅每月 300 美元,前六个月促销价 99 美元。

值得一提的是,Grok Build 原生兼容 Claude Code 的 CLAUDE.md 配置文件。
没错,xAI 做的工具,原生支持竞品 Claude 的配置格式。
Claude Code 在开发者中的地位已经是事实标准,而 xAI 为了降低迁移成本,愿意主动兼容对手生态。
务实,但也多少有点心酸。
至此,三步棋全部落完——收购拿分发,数据拿能力,Agent 拿入口。
全部指向同一个目标:AI编程。
Grok 离编程王座还有多远?
把 Grok 放到编程赛道的坐标系里,差距一目了然。
SWE-bench Verified 是目前开发者社区最关注的 AI 编程基准测试。
然而,与 OpenAI 和 Anthropic 相比,Grok 差的是一整个身位——
-
GPT-5.5:88.7%。
-
Claude Opus 4.6:80.8%。
-
Grok 4 系列:72%-75%。
更惨的是企业采用率。
Enterprise Technology Research 的数据显示,截至 2026 年 3 月,企业用户中 OpenAI 占 55%,Anthropic 从一年前的 20% 飙升到 47%,谷歌 39%。而 Grok 只有区区的6%。

参数翻三倍加上 Cursor 数据,V9-Medium 确实有可能带来质变。
但参数规模和能力从来不是线性关系,训练数据质量和 RLHF 精度往往更关键。
有分析推测,xAI 可能在预训练后期就已经灌入了大量编程数据,类似 Cursor Composer 2.5 的 heavy mid-training 策略,这样 post-training 阶段确实可以压缩。
6 月决战,四家硬碰硬
马斯克选择在这个时候亮牌,时间点很微妙。
SpaceX 将于 6 月 12 日在纳斯达克上市,目标估值 1.75 万亿美元,若成功将是史上最大 IPO。收购 Cursor 的 600 亿美元交易预计在 IPO 后 30 天内完成。
V9-Medium 的公开发布,恰好卡在 IPO 之前。
更可怕的是,这不是马斯克一个人在加速。
OpenAI 的 GPT-5.6已经在 Codex 后台泄露,代号 iris-alpha,150 万 Token 上下文窗口实测跑通。Polymarket 预测 6 月底前发布概率超过 85%。
Anthropic 的 Claude Opus 4.8已在 Google Vertex 后台现身。Sonnet 4.8 跳过 4.7 直奔 4.8。曾被称为「太危险不公开」的 Mythos 1,也在 Claude 界面短暂露脸。
谷歌的 Gemini 3.5 Pro,同样定档 6 月。
四家前沿实验室,同一个月,硬碰硬。这个 6 月,注定是 2026 年 AI 领域最惨烈的一场混战。
前沿实验室之间的差距现在已经缩到以周为单位,单次发布不再重要,节奏才是关键。

马斯克赌的就是这个节奏。
V9-Medium 不需要一炮封王,它需要的是证明 xAI 还在牌桌上,而且手里不止一张牌。
至于那台月租 12.5 亿美元租给 Anthropic 的 Colossus 1——帮对手训模型的同时,也在帮自己续命。
这场 AI 军备竞赛里,活着比赢更重要。
而活着的前提,是有人愿意为你的算力买单。哪怕那个人,恰好是你的对手。
参考资料:
https://x.com/testingcatalog/status/2058800215960719861
https://x.com/elonmusk/status/2058787384364265734
编辑:摩西
