
新智元报道
OpenAI 首颗自研芯片 Jalapeño问世,9 个月白纸到流片,创下行业最快纪录。设计它的,正是跑在上面的 AI 模型。
就在刚刚,OpenAI 掏出了史上第一颗自研芯片。
名字叫 Jalapeño,墨西哥辣椒,专为大模型推理设计。

9 个月前,白纸一张。
9 个月后,工程样片不仅跑通了 GPT-5.3-Codex-Spark,而且频率和功耗均已达到量产目标。
更离谱的是,这颗芯片是 OpenAI 用自己的 AI 帮着画的。
9 个月,行业纪录碎了
Jalapeño,墨西哥辣椒里辣度最温和的品种之一。
OpenAI 拿它给第一颗芯片命名,潜台词很可能是:这只是入门级,后面可能还有更辣的。
官方定位叫「Intelligence Processor」,一颗专为大模型推理设计的定制 ASIC。
由 OpenAI 主导架构设计,Broadcom 负责芯片实现和网络互联,Celestica 做板卡和机架集成。

通常来说,先进半导体行业,设计一颗高性能 ASIC 要 18 到 24 个月。Google TPU 两年一代,Amazon Trainium 差不多也是这个的节奏。
而 OpenAI 只用了 9 个月,一举刷新了先进半导体领最快的 ASIC 开发周期。
这颗芯片从第一根线开始就只为一件事优化:LLM 推理。
而且,Jalapeño不只跑 OpenAI 自家模型,架构上兼容全行业的 LLM。

AI 帮自己画了电路图
比性能更值得关注的,是这颗芯片怎么被造出来的。
OpenAI 自家 AI 模型参与了这颗芯片的设计和优化。
也就是说——AI 设计了一颗芯片,芯片反过来跑 AI,跑在上面的更强 AI 会设计下一代更强的芯片。
AI,帮自己造了一副新身体。
AI 设计芯片不新鲜。Google 2021 年在 Nature 发论文,用强化学习做芯片布局,速度比人类快几个数量级。
此后 AlphaChip 连续优化了三代 TPU 布局方案。
OpenAI 硬件团队的掌门人 Richard Ho,正是从这个圈子里走出来的。

Google 近九年,TPU 高级工程总监,参与发明了 ML 设计芯片架构的方法,多个 TPU 项目首次流片即成功。
之后去了光子计算公司 Lightmatter 当高级副总裁,更早联合创办过 EDA 公司0-In Design Automation。学术界、芯片设计、AI 硬件,整条路走了一遍。


OpenAI 挖他来,大概率就是为了一件事:把「AI 辅助芯片设计」嫁接到自家模型上。
芯片设计最磨人的不是「想方案」,是无数次的设计—验证—改—再验证循环。一颗先进芯片的验证要跑成千上万次,占掉整个周期的大半时间。
AI 恰恰擅长干这种事——读历史设计数据、生成 RTL 代码、辅助验证和 debug、优化布局布线。
能实现 9 个月流片,靠的是 AI 替人扛掉了那「18 到 24 个月」里最磨人的一大块。
用最会用锤子的人,来设计新锤子。用最懂 LLM 运行规律的模型,来设计专门跑 LLM 的硬件。

你的 ChatGPT 账单正在被重写
OpenAI 每年算力支出百亿美元级别,这些钱最终要从你身上赚回来——20 美元月费、API 调用、Plus 和 Pro 订阅。
推理成本砍半,普通用户最先感受到的:响应变快。
现在 ChatGPT 高峰期排队、转圈、长对话变慢,本质都是算力不够分。
推理效率提升后,同等服务器能服务更多用户,体验有望改善。
其次:免费版能力放开。
现在很多功能锁在 Plus 里——深度研究、高级数据分析、完整版语音对话。
成本降了,这些功能下放给免费用户的可能性就大了。
而 OpenAI 需要的,正是让更多人用上 ChatGPT,并且能用更久。
再往远看:20 美元的月费可能还是 20 美元,但你拿到的东西完全不一样。
去年这个价格买到的是 GPT-4o,明年同样的钱可能买到的是一个能跑完整工作流的 agent。
月费没变,能力可能翻几番——推理成本下降带来的隐性降价。

但 Jalapeño瞄准的不只是今天的 ChatGPT。
Richard Ho 的思路是:为模型要去的方向设计硬件,而不是为它现在的样子。
OpenAI 内部能看到未来 6 到 9 个月模型的演进方向,芯片按这条管线往前造。
等 agent 真正跑起来,算力需求和今天的一问一答完全不是一个量级。
说白了,推理成本降下来,受益的不只是 Pro 用户。
学生、小企业、独立开发者,都可能用上今天只有大客户才跑得起的 AI 能力。
OpenAI 要吃掉整条链
模型自己训,芯片自己设计,推理自己优化,部署自己控制。
换句话说,OpenAI 要做全栈 AI 公司。
之前和 Cerebras 合作推理部署,OpenAI 从中摸清了专用推理硬件的价值。现在自己下场做,把经验变成自己可控的平台。
Apple 和 Google 都走过这条路。
但 OpenAI 的全栈多了一层:
用 AI 加速 AI 基础设施建设,再用更好的基础设施跑更强的 AI。如果这个循环成立,飞轮会自己给自己加速。
首批 GW 级数据中心将和 Microsoft 等合作方从 2026 年底开始部署。
Jalapeño只是第一代,下一代叫什么还不知道。
但造它的,大概率不只是人了。
参考资料:
https://x.com/OpenAI/status/2069770172802773292
https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
编辑:摩西
