OpenAI把目光投向了AMD、Cerebras和Groq这些英伟达的竞争对手,试图在AI推理芯片这个新兴战场上找到更快的解决方案。OpenAI的奥特曼持有Cerebras芯片公司股份。OpenAI的Codex面临Claude Code/OpenCode等智能体IDE竞争。
这场博弈的核心在于推理芯片的速度,英伟达虽然在训练芯片领域依然称王称霸,但在推理这个关键环节,OpenAI想要更快的响应速度来满足编程助手Codex等产品的需求。与此同时,英伟达原本计划向OpenAI投资100亿美元的大交易也因此拖延,整个AI芯片江湖正在经历一场微妙的权力重构。
当ChatGPT的爸爸开始嫌弃"芯片一哥"
你家开了个超级火爆的奶茶店,每天排队的人从街头排到街尾,这时候你发现做杯子的供应商给你的杯子总是漏底,顾客抱怨等太久。你会怎么做?当然是连夜找新的杯子供应商啊!
OpenAI现在就是这个心态,只不过人家做的不是奶茶,而是每天处理上亿次请求的ChatGPT,而那个"漏底杯子"的供应商,正是市值曾经突破3万亿美元的芯片霸主英伟达。
这个故事的开端要追溯到2024年,那时候OpenAI内部就开始流传一个不太妙的消息:英伟达的最新AI芯片在某些关键任务上表现得像个慢吞吞的树懒。
八个了解内情的人士向路透社爆料:OpenAI对英伟达的部分芯片越来越不满意,这种不满情绪就像滚雪球一样越滚越大,最终促使OpenAI开始了一场声势浩大的"芯片备胎计划"。
你要知道,在硅谷这个圈子里,八个人同时向同一家媒体爆料,这基本上等于整个行业都在传这个八卦了。
这场风波的核心焦点在于AI推理芯片!
简单来说:
训练芯片就像是教一个学生读书认字,需要大量的时间和计算资源把知识灌输进去;
而推理芯片则是这个学生毕业后来回答你的问题,需要的是快速反应和流畅表达。
英伟达在"教学生"这个环节依然是无可争议的王中王,但在"回答问题"这个环节,OpenAI觉得英伟达的表现开始有点拉胯了。特别是当ChatGPT要处理编程相关的问题,或者要和其他软件进行复杂交互的时候,英伟达芯片的响应速度让OpenAI的工程师们抓耳挠腮。
推理芯片:AI世界的"秒回"战场
现在的AI竞争已经进入了一个全新的阶段,大家都在拼谁能更快地回答用户的问题。想象一下你问ChatGPT"怎么用Python写个爬虫",结果它思考了十秒钟才给你答案,这时候你的咖啡都凉了,耐心也耗光了。OpenAI深知在这个注意力稀缺的时代,速度就是生命,延迟就是死亡。用户不会等你,他们会立刻转向竞争对手的产品。
推理芯片的重要性就在于此。当数百万用户同时向ChatGPT提问时,芯片需要在毫秒级别内从庞大的AI模型中提取信息、进行计算、生成回答。这个过程对内存的需求比训练阶段更高,因为芯片需要频繁地从内存中调取数据,而不是简单地做数学运算。英伟达的GPU架构依赖于外部内存,这就好比你要做一道菜,但每次拿调料都要跑到隔壁房间去取,自然慢人一步。
OpenAI内部对这个问题感受最深的是Codex团队。Codex是OpenAI力推的编程助手产品,专门帮程序员写代码、改bug。想象一下一个程序员正在紧张地debug,向Codex求助,结果Codex卡住了,半天不给回应,那种抓狂的感觉简直要让人砸键盘。消息人士透露,OpenAI内部把Codex的一些性能问题直接归因于英伟达的GPU硬件。这就像你买了辆法拉利,结果发现它在赛道上跑不过别人的五菱宏光,那种憋屈感可想而知。
山姆·奥特曼在2026年1月30日的记者电话会上直接放话:使用OpenAI编程模型的客户会对速度有极高的要求,速度就是一切,慢一秒就是少赚一分钱。这句话的潜台词很明白:英伟达,你的芯片不够快,我要找更快的。
奥特曼还透露,OpenAI将通过与Cerebras的合作来满足这种对速度的渴求,而对于那些随便聊聊天的普通用户,速度要求就没那么苛刻。这话说得够直白,基本上等于公开宣布英伟达在推理领域已经不够看了。
英伟达的帝国裂缝:从唯一选择到众多选择之一
英伟达在AI芯片领域的统治地位曾经看起来坚不可摧,就像当年的英特尔在PC处理器市场的地位一样。但历史告诉我们,没有永远的霸主,只有永远的竞争。OpenAI寻找替代方案的决定,标志着英伟达面临着一个严峻的考验:它能否在推理芯片这个新战场上继续保持领先?
这个考验来得正是时候,因为英伟达和OpenAI正在谈一笔价值高达1000亿美元的投资。2024年9月,英伟达宣布打算向OpenAI注资最多1000亿美元,这笔交易本来预计几周内就能敲定。按照原计划,英伟达通过这笔投资获得OpenAI的股份,OpenAI则获得购买先进芯片的现金。这看起来像是一场双赢的婚姻,芯片巨头和AI巨头强强联合,统治整个世界。
但现实往往比剧本更精彩。谈判拖了好几个月都没有结果,就在这段时间里,OpenAI开始四处撒网,与AMD等公司达成了GPU合作协议。OpenAI的产品路线图发生了重大变化,对计算资源的需求也随之改变,这进一步拖慢了与英伟达的谈判进度。知情人士透露,OpenAI现在需要的芯片类型和英伟达能提供的产品之间出现了错位,这种错位让双方的谈判陷入了僵局。
英伟达CEO黄仁勋在2026年2月1日接受媒体采访时,被问到与OpenAI关系紧张的问题,他的回应堪称教科书级别的否认:"胡说八道"。黄仁勋坚称英伟达计划对OpenAI进行巨额投资,一副"我们好得很"的姿态。英伟达在官方声明中也强调,客户继续选择英伟达进行推理,因为英伟达在大规模部署中提供了最佳的性能和总体拥有成本。OpenAI的发言人则回应说,公司依靠英伟达为其绝大多数推理计算提供动力,英伟达在推理方面提供了最佳的每美元性能。
这两份声明看起来和和气气,但明眼人都能读出其中的火药味。OpenAI说"绝大多数"依靠英伟达,言下之意就是"不是全部";说英伟达"每美元性能最佳",潜台词就是"我们在考虑性价比之外的因素"。这种外交辞令背后的真实情绪,就是那八个爆料人士透露的不满。
SRAM芯片:速度狂魔的秘密武器
OpenAI寻找替代方案的重点落在了一类特殊的芯片上:SRAM芯片。这玩意儿的全称是静态随机存取存储器芯片,听起来很技术宅,但理解起来很简单。传统的GPU,包括英伟达和AMD的产品,都依赖于外部内存,数据需要在芯片和外部内存之间来回搬运,这就产生了延迟。而SRAM芯片把大量内存直接嵌入到同一块硅片上,数据就在芯片内部流动,速度快得飞起。
这种架构对于聊天机器人和其他AI系统来说是一个巨大的优势。当数百万用户同时发送请求时,SRAM芯片可以在瞬间完成数据调取和计算,用户体验就是"秒回"的畅快感。OpenAI从去年开始就把目光投向了那些专注于SRAM芯片的公司,这种选择背后的逻辑非常清晰:既然英伟达在速度上满足不了我,那我就找专门做速度的公司。
Cerebras和Groq就是两家主打SRAM架构的芯片创业公司。Cerebras以其巨大的晶圆级芯片闻名,一块芯片就有整个晶圆那么大,上面集成了海量的计算核心和内存。Groq则以其张量流处理器架构著称,专为AI推理优化,速度极快。OpenAI与这两家公司都进行了接触,探讨合作的可能性。
消息人士透露,OpenAI与Groq进行了深入的谈判,讨论由Groq提供计算能力的合作方案。Groq还吸引了投资者的兴趣,估值达到了约140亿美元。一切看起来都很顺利,OpenAI似乎找到了理想的"备胎"。但就在2024年12月,英伟达突然出手,与Groq达成了一项价值200亿美元的非独家技术许可协议。这是一笔全现金交易,虽然允许其他公司继续许可Groq的技术,但Groq现在把重点转向了销售云端软件,而且英伟达还挖走了Groq的芯片设计师。
这一招堪称釜底抽薪。OpenAI与Groq的谈判被迫中断,英伟达通过这种方式既获得了一项互补的技术,又阻止了竞争对手与OpenAI的联姻。芯片行业的高管们认为,英伟达此举是为了巩固其技术组合,以更好地应对快速变化的AI行业竞争。英伟达在声明中表示,Groq的知识产权与其产品路线图高度互补。这话翻译过来就是:你们的宝贝技术现在归我了,你们继续玩软件去吧。
Cerebras的逆袭:当巨人转身时
在英伟达收购Groq的同时,另一家SRAM芯片公司Cerebras做出了不同的选择。面对英伟达的收购意向,Cerebras选择了拒绝,转而与OpenAI达成了商业合作协议。这个消息在2026年1月宣布,Cerebras将为OpenAI提供推理计算能力,帮助OpenAI满足对速度有极高要求的应用场景。
Cerebras的选择代表了一种独立发展的路径。与其被英伟达收入麾下,不如与OpenAI这样的AI巨头结盟,在市场中保持独立地位。这种策略的风险在于要面对英伟达的全面竞争压力,但好处是可以灵活地服务多个客户,而不只是成为英伟达技术组合的一部分。Cerebras拒绝对路透社的报道发表评论,这种沉默本身就是一种态度。
对于OpenAI来说,与Cerebras的合作是一个重要的战略支点。奥特曼在记者会上明确提到了这笔合作,表示将通过Cerebras来满足编程模型客户对速度的需求。这意味着Cerebras的芯片将承担OpenAI约10%的推理计算需求,虽然比例不大,但象征意义重大。这是OpenAI第一次大规模采用非英伟达的芯片进行核心推理任务,标志着其供应链多元化的正式开始。
这种多元化背后有一个残酷的现实:OpenAI不能再把所有的鸡蛋放在英伟达这一个篮子里。英伟达的芯片供应一直紧张,价格高昂,而且在推理速度上又达不到OpenAI的要求。通过引入Cerebras和AMD等竞争对手,OpenAI可以增强自己的议价能力,降低对单一供应商的依赖,同时为未来的技术路线保留更多选择空间。
竞争对手的阳谋:谷歌TPU的启示
在OpenAI为推理芯片发愁的时候,它的主要竞争对手们已经在享受定制芯片带来的优势了。Anthropic的Claude和谷歌的Gemini都大量部署了谷歌自研的张量处理单元,也就是TPU。这些芯片专为AI推理所需的计算类型设计,在性能上可以超越英伟达的通用GPU。
谷歌的TPU战略给整个行业上了一课。当其他公司还在购买通用芯片的时候,谷歌就开始自研专用芯片,针对自己的AI模型进行深度优化。这种垂直整合带来的性能优势是显而易见的:同样的模型,在TPU上运行可能比在GPU上运行更快、更省电、成本更低。Anthropic作为谷歌的重要合作伙伴,也享受到了TPU的红利,这让Claude在某些场景下的响应速度具备了竞争优势。
OpenAI显然看到了这种威胁。如果竞争对手的AI助手总是比ChatGPT快半秒,用户就会慢慢流失。在半导体的世界里,半秒的差距可能就是生死之别。OpenAI没有谷歌那样的芯片设计能力,所以它选择了与Cerebras、Groq这样的专业芯片公司合作,试图通过外部创新来弥补内部能力的不足。
这种策略的风险在于,Cerebras和Groq都是创业公司,产能有限,技术成熟度也不如英伟达。但OpenAI似乎愿意承担这个风险,因为速度优势带来的用户留存率提升可能远远超过技术风险带来的潜在损失。在AI这个赢家通吃的市场里,慢一点就意味着失去一切。
投资谈判的罗生门:1000亿美元何去何从
英伟达与OpenAI之间那笔1000亿美元的投资谈判,现在成了一个巨大的悬念。这笔交易本来被寄予厚望,被认为是巩固双方联盟的关键一步。但现在,随着OpenAI对英伟达芯片的不满公开化,以及OpenAI与AMD、Cerebras等竞争对手的合作加深,这笔交易的前景变得扑朔迷离。
从英伟达的角度看,投资OpenAI是一个战略 necessity。OpenAI是AI领域最耀眼的明星,ChatGPT是全球用户量最大的AI应用。如果英伟达能成为OpenAI的股东,不仅能锁定一个巨大的芯片客户,还能在AI发展的关键决策中拥有话语权。黄仁勋多次公开表达对OpenAI的支持,强调英伟达计划进行巨额投资,这本身就说明了英伟达对这笔交易的重视程度。
但从OpenAI的角度看,接受英伟达的投资意味着更深度的绑定。如果OpenAI已经决定在推理芯片领域寻求多元化,那么接受英伟达的投资可能会限制其选择自由。投资者通常会对被投公司的采购决策产生影响,OpenAI不希望在选择芯片供应商时受到股东的掣肘。这种矛盾让谈判变得异常复杂。
消息人士透露,OpenAI产品路线图的变化是谈判拖延的一个重要原因。OpenAI正在开发的新一代AI模型对计算架构提出了新的要求,这些要求与英伟达现有的产品规划并不完全吻合。双方需要就未来的技术方向达成一致,才能敲定投资条款。这个过程比预期的要漫长得多,也痛苦得多。
现在的问题是,这笔交易还能不能成?如果成了,条款会不会大幅修改?如果不成,双方的关系会不会恶化?这些问题的答案将深刻影响整个AI产业的格局。1000亿美元不是小数目,这笔交易的走向将成为观察AI产业权力结构变化的一个重要窗口。
速度至上的时代:用户耐心正在消失
OpenAI对推理速度的执着追求,反映了一个更广泛的行业趋势:用户对AI产品的耐心正在快速消失。在ChatGPT刚推出的时候,用户愿意等上几秒钟甚至十几秒钟来获得一个神奇的回答。但现在,AI产品遍地开花,用户的期望值被不断拉高,等待时间被不断压缩。
编程助手Codex是这种趋势的典型代表。程序员在使用Codex时,通常处于高度集中的工作状态,思维流畅,手指在键盘上飞舞。这时候如果Codex卡住不动,程序员的思路就会被打断,工作效率大幅下降。山姆·奥特曼说得没错,编程用户愿意为速度支付高额溢价,因为时间对他们来说就是金钱,就是竞争力。
这种对速度的渴求正在重塑AI芯片市场的竞争格局。传统的竞争焦点是训练性能,谁能更快地训练出更大的模型,谁就能赢得市场。但现在,推理性能正在成为新的战场。谁能以更低的延迟处理更多的用户请求,谁就能提供更好的用户体验,就能在激烈的市场竞争中脱颖而出。
英伟达在这个新战场上遇到了挑战。其GPU架构虽然在训练任务上无可匹敌,但在推理任务上却面临着内存带宽的瓶颈。外部内存的访问延迟成为了性能提升的障碍,而SRAM架构的芯片则可以绕过这个障碍。这就是为什么OpenAI把目光投向了Cerebras和Groq,这也是为什么英伟达急于通过收购Groq来填补技术空白。
产业格局的重构:从一家独大到群雄并起
OpenAI寻找芯片替代方案的举动,标志着AI芯片产业正在从英伟达一家独大的格局向群雄并起的格局演变。这种演变对产业的健康发展是有利的,竞争可以带来创新,可以降低价格,可以避免单一供应商带来的系统性风险。
AMD是这个新格局中的重要玩家。作为英伟达在GPU领域的老对手,AMD一直在努力追赶。OpenAI与AMD达成的合作协议,为AMD进入高端AI推理市场提供了一个绝佳的跳板。如果AMD能够抓住这个机会,证明其芯片在大型AI应用中的可靠性和性能,那么它有望打破英伟达在AI芯片市场的垄断地位。
Cerebras和Groq代表了另一种竞争路径:通过架构创新来挑战 incumbent。它们不试图在英伟达擅长的领域正面竞争,而是专注于SRAM这种英伟达尚未充分布局的技术路线。这种差异化竞争策略在产业变革期往往能够取得意想不到的效果。虽然Groq已经被英伟达收入麾下,但Cerebras的独立发展为这种创新路径保留了火种。
谷歌的TPU则展示了垂直整合的力量。通过自研芯片来服务自有的AI模型,谷歌实现了硬件和软件的深度协同优化。这种模式正在被越来越多的大型科技公司效仿。虽然OpenAI没有谷歌那样的资源来自研芯片,但它通过与Cerebras等公司的合作,在某种程度上复制了这种垂直整合的优势。
黄仁勋的反击:帝国不会坐以待毙
面对OpenAI的"背叛"和竞争对手的围剿,黄仁勋和英伟达不会坐以待毙。这位以皮衣形象深入人心的芯片大佬,是硅谷最具攻击性的CEO之一。他的"胡说八道"回应虽然看起来轻松,但背后的动作却一点都不轻松。
收购Groq就是英伟达反击的第一步。通过200亿美元的技术许可协议,英伟达既获得了一项关键的SRAM技术,又阻止了OpenAI与Groq的联姻。这种"你得不到的我也不能让你得到"的策略,虽然代价高昂,但在战略上是有效的。英伟达在声明中强调Groq的知识产权与其产品路线图高度互补,这意味着我们可能在未来的英伟达产品中看到SRAM架构的身影。
黄仁勋还计划对OpenAI进行巨额投资,这既是一种示好,也是一种绑定。如果这笔投资最终达成,英伟达将成为OpenAI的重要股东,在OpenAI的董事会中拥有发言权。这将使英伟达能够更好地影响OpenAI的技术路线选择,确保其芯片在OpenAI的供应链中保持核心地位。
更重要的是,英伟达正在加快产品迭代的速度。面对SRAM架构在推理任务上的优势,英伟达很可能会推出集成更多片上内存的新一代GPU,或者开发专门的推理芯片产品线。英伟达的技术积累和资金实力是任何竞争对手都无法忽视的,一旦它决定在某个领域发力,往往能够迅速缩小差距。
结语:AI芯片江湖的新篇章
OpenAI与英伟达之间的这场博弈,是AI产业发展到一定阶段的必然产物。当AI应用从实验室走向大众,从玩具变成基础设施,对性能、成本、可靠性的要求就会指数级上升。这种上升的压力会传导到产业链的每一个环节,芯片作为最基础的计算单元,自然成为竞争最激烈的战场。
这场博弈没有绝对的赢家和输家。英伟达可能会失去一部分市场份额,但其在AI芯片领域的领导地位短期内难以撼动。OpenAI可能会找到更快的芯片,但适配新芯片的成本和风险也不容小觑。AMD、Cerebras等挑战者获得了宝贵的机会,但要真正威胁英伟达的统治地位还有很长的路要走。
对于整个AI产业来说,这种竞争是健康的。它推动了技术创新,降低了进入门槛,为用户带来了更好的产品和体验。当尘埃落定,我们可能会看到一个更加多元化、更具活力的AI芯片生态系统,而这正是产业成熟和发展的标志。
在这个充满变数的时代,唯一确定的是变化本身。OpenAI的芯片选美大赛才刚刚开始,更多的剧情反转和技术突破还在路上。作为吃瓜群众,我们只需要准备好爆米花,欣赏这场硅谷最精彩的商业大戏。