英伟达(Nvidia)收购Groq表面上看,这似乎只是巨头吞并初创公司的又一例证,但如果你只看到这一层,那就太小看黄仁勋的野心了。事实上,这笔交易背后,藏着英伟达对下一代AI计算架构的颠覆性布局,甚至可能彻底改写全球AI芯片的竞争格局。
今天我们就来深度拆解:为什么英伟达要买Groq?为什么偏偏是现在?
SRAM架构在解码方面具有独特的优势
很多人以为AI推理就是“输入问题、输出答案”那么简单,但其实,真正的推理过程可以拆解为两个截然不同的阶段:预填充(Prefill)和解码(Decode)。
预填充阶段要处理的是整个上下文——比如你输入一个5000字的论文要求总结,模型得先把这5000字全部“吃进去”,这个阶段极度依赖高内存容量;
而解码阶段则是逐个生成token,比如“总…结…如…下…”,这时候每一毫秒的延迟都直接决定用户体验,因此极度依赖超高内存带宽。
而英伟达下一代旗舰芯片Rubin,其实已经在悄悄布局这两大场景:
Rubin CPX专攻预填充,靠着超大容量但带宽相对较低的GDDR显存,适合处理超长上下文;
标准版Rubin则用HBM显存,在训练和高吞吐批量推理之间取得平衡;
但唯独缺了一块——那个能在单用户、超低延迟场景下“秒出答案”的芯片。而Groq,恰恰就是靠SRAM架构,在解码阶段实现了近乎恐怖的带宽密度,虽然容量小、成本高,却能为每个用户带来“即时响应”的体验。
英伟达买下Groq,就等于拿到了“Rubin SRAM”这张王牌,从此形成“三芯合璧”:CPX处理上下文、Rubin扛批量、SRAM打实时交互——组合拳一出,谁与争锋?
用户愿意为“速度”买单!
一年半前,整个行业还在争论:SRAM架构虽然快,但每token成本太高,因为无法像GPU那样靠大批量并行摊薄成本。很多人认为,除了科研或特殊场景,没人会为这种“奢侈性能”买单。但现实狠狠打了这些人的脸。
Groq和Cerebras的市场验证打脸所有怀疑者
Groq最近的客户反馈和商业数据表明:高端AI应用——尤其是那些主打“实时交互”“个性化代理”(agentic reasoning)的产品——用户真的愿意多花钱换速度!想想看,当你和一个AI助手对话,它每句话都要卡2秒,和它能像真人一样“无缝接话”,体验差距有多大?特别是在客服、金融交易、医疗诊断、自动驾驶决策等场景,毫秒级延迟就是生死线。
而Cerebras——另一家SRAM架构的巨头,虽然在系统集成上不如Groq灵活(它的晶圆级引擎WSE几乎必须独立成柜),但在公开性能榜单上长期领先Groq。如今Groq被英伟达收入囊中,Cerebras反而成了唯一独立的SRAM玩家,战略价值瞬间飙升。可以预见,接下来它要么被AMD或某家云厂商高价收购,要么成为AI基础设施领域的“瑞士军刀”——专供那些不愿绑定英伟达生态的客户。
除了TPU、AI5和Trainium,其他AI芯片都危险了?
更令人震撼的是, 未来除了谷歌的TPU、微软的AI5(Maia)和亚马逊的Trainium,其他所有自研AI芯片项目都可能被砍掉。
为什么?因为英伟达一旦整合Groq,就拥有了覆盖全场景的“Rubin三兄弟”+多款高速互联芯片(比如NVLink和Quantum InfiniBand),形成从训练到推理、从高吞吐到超低延迟的完整闭环。Meta的MTIA、微软早前的自研尝试、甚至英特尔和AMD的部分项目,在这种“全栈碾压”面前,几乎毫无胜算。
有趣的是, Meta竟然买了Rivos——一家原本做RISC-V高性能CPU的公司,而非AI加速器。这说明Meta可能彻底放弃了在AI加速芯片上的正面竞争,转而押注通用计算或生态控制。
而英特尔倒是很早就嗅到了风向,不仅推出了专为预填充优化的芯片SKU,还收购了SambaNova——尽管SambaNova在SRAM赛道中实力最弱。
相比之下,AMD目前还在观望,但留给它的时间不多了。如果不能在2026年前拿出有竞争力的推理芯片组合,很可能彻底沦为英伟达的陪跑者。
Groq的“多芯片机架”设计,为何比Cerebras更受英伟达青睐?
这里有个技术细节特别关键:Groq的系统采用“多芯片机架”架构,这意味着它可以像搭积木一样,灵活部署在标准服务器机柜中,甚至能直接接入英伟达现有的网络栈(比如BlueField DPU和Quantum交换机)。
而Cerebras的晶圆级引擎(WSE)是一整块7纳米晶圆做成的单芯片,尺寸巨大,散热和供电都极其特殊,几乎必须独立部署一整套机柜。
对于英伟达来说,收购Groq不仅能获得技术,还能无缝整合进现有数据中心生态,客户迁移成本极低。而Cerebras虽然性能更强,但“太个性”,整合难度大,商业落地门槛高——这也是为什么英伟达选择了Groq,而不是Cerebras。
Nvidia Buys Groq to Dominate AI Inference with Three Chip Strategy