英伟达承认GPU打不过定制推理芯片:低头出钱200亿买Groq授权!


英伟达豪掷200亿美元“娶”Groq,不是秀肌肉,而是偷偷打补丁:GPU神话在推理战场第一次漏气,ASIC反杀号角吹响,75%毛利率帝国开始裂缝。

作者是谁?——Chaotropy,华尔街对冲基金前芯片分析师,硅谷AI硬件创业老兵,拍过非洲母狮撕咬角马,也拍过GPU撕咬TPU,推特@chaotropy,人狠话更狠,专写资本不敢写的内幕。

开场先放炸弹:老黄去年还在斯坦福放话“对手白送芯片都没人要”,今年就掏200亿美元把Groq连锅端,脸打得比GPU风扇还响,硅谷脱口秀演员连夜把这段写进段子,观众笑完才发现——这哪是段子,这是财报预告片。

黄仁勋那副自信到发光的笑容,现在成了华尔街分析师深夜失眠的噩梦背景图。200亿美元不是个小数目,它相当于英伟达整个数据中心业务一个季度的利润,却只为买一个非独家授权和几个工程师,背后信号比任何财报数据都刺眼:英伟达的GPU帝国,正在推理战场上出现第一个无法忽视的裂缝。

200亿美元到底买了啥?——非独家授权+两位创始人“人肉收购”,Groq最新估值才69亿,英伟达直接三倍溢价,相当于用一辆劳斯莱斯换一辆改装比亚迪,还要自己加油,华尔街分析师集体把Excel表格拉到冒烟也算不出IRR,只能骂娘“老黄疯了”。

但冷静下来一想,这哪是疯,这是怕。Groq虽然小,但它那套LPU(语言处理单元)架构已经让Meta、谷歌、甚至微软内部实验室惊呼“这玩意儿推理快得不像话”。老黄不是买技术,是买时间,买客户不叛逃的缓冲期,买自己还能坐在牌桌上喊“AI基础设施由我定义”的最后底气。

别急,老黄没疯,他精得很:GPU在训练市场像印钞机,但在推理市场被ASIC按在地上摩擦,延迟高、功耗大、价钱贵,客户爸爸从Meta到微软都在偷偷搞“小芯片”,英伟达再不补洞,明年财报就真变“绿色”——不是美元绿,是亏损绿。

推理市场和训练市场完全是两个逻辑:训练是“我要最强”;推理是“我要最省”。

GPU像法拉利,跑赛道无敌,但每天上下班送孩子上学?谁受得了那油钱?
而Groq的LPU就像电动自行车,不能漂移不能甩尾,但每天跑一百公里电费只要几毛,而且准时准点从不堵车。

超大规模云厂商算盘一打,一年省下几十亿电费,还提升用户体验,何乐不为?

极客一语道破
这就是英伟达是显卡出身,而不是云厂商出身造成的视角盲区,因为芯片显卡的直接下游客户是云厂商和挖矿,而云厂商的直接下游客户才是AI大模型。

英伟达与ChatGPT之间隔着微软云厂商,这三者在行业一开始可以捆绑很紧,但是捆绑越紧就视角越小,彼此成了彼此的上下文约束!



把时钟拨回2024年3月,老黄在斯坦福笑眯眯说“我们的芯片好到免费都贵”,台下学生鼓掌,媒体写标题“英伟达无敌”,结果18个月后,无敌的英伟达连夜敲Groq家门“兄弟,芯片卖我,顺便把人也带上”,场面堪比iPhone14发布会后库克偷偷去华强北买充电宝,尴尬到脚趾抠出三纳米。

更讽刺的是,Groq创始人Jonathan Ross正是当年谷歌TPU项目的核心架构师之一,亲手打造了GPU的第一个真正对手。如今老黄把他挖来,等于让造反的猛将回朝当侍卫,政治意味拉满——不是我打不过你,是我把你变成我。打不赢就用钱加入!

Groq的LPU到底多香?——干掉GPU调度器,指令周期像高铁时刻表一样 deterministic,推理延迟低到怀疑人生,同样跑175B模型,功耗只有GPU三分之一,价格直接腰斩,客户一算账:省下来的电费够给团队发年终奖,谁还管你CUDA生态,钱包才是最大生态。

Groq的架构核心是“全硬件流水线”,没有软件调度开销,所有计算单元按预设路径流动,像瑞士手表一样精准。

这意味着每一条token的生成都能在固定时钟周期内完成,不会出现GPU那种“等调度器分配资源”的卡顿。对于聊天机器人、推荐系统这些需要毫秒级响应的场景,Groq几乎是降维打击。Meta工程师私下测试后说:“用Groq跑Llama 3,响应速度比H100快2.8倍,而电费账单少了40%。”这种数据,比任何PPT都管用。

更吓人的是,Meta被曝正在和谷歌谈TPU大单,TPU!谷歌!这俩名字放在一起就像可口可乐找百事代工,世界线直接错乱,如果Meta真把GPU预算砍一半,英伟达数据中心收入立马少一条腿,

老黄连夜飞硅谷,手提箱里装着200亿美元“求和信”。

要知道,Meta是英伟达最大的客户之一,其Llama系列模型几乎全靠H100集群支撑。一旦Meta大规模转向TPU或类似Groq的ASIC,不仅英伟达营收受损,更会引发连锁反应——其他云厂商会立刻跟进:“连Meta都跑了,我们还等什么?”这种“客户叛逃”风险,比技术落后更致命。



英伟达最近两次收购像急诊室连环抢救:先花9亿美元把网络独角兽Enfabrica打包,再200亿吞Groq,都是“点对点止血”,因为博通在背后举着手术刀帮亚马逊、微软设计定制ASIC,刀刀见血,英伟达再不出手,客户连主板都要自己画。

博通CEO陈福阳早就放话:“我们不做通用芯片,我们做客户想要的芯片。”这句话像幽灵一样缠着英伟达。

过去CUDA生态是护城河,现在客户说:“我不需要生态,我只需要能跑Llama 4的芯片,便宜、省电、稳定就行。”英伟达只能一边加速自研Blackwell Ultra,一边狂吞外部技术,试图用“内部ASIC方案”堵住客户流失的缺口。

华尔街最慌的是:75%毛利率神话还能撑多久?训练芯片是卖方市场,推理芯片是买方市场,客户张口就是“便宜点,再便宜点”,英伟达从“爱买不买”到“大哥别走”只隔了18个月,分析师模型里那条笔直向上的毛利率曲线,如今被ASIC砍成悬崖跳水。

要知道,英伟达的估值建立在“长期高毛利”假设上。如果推理芯片毛利率被迫降至50%甚至更低,整个估值模型就要重写。

更糟的是,ASIC一旦量产,成本下降曲线比GPU陡峭得多,英伟达很可能陷入“降价保份额 vs 保利润丢客户”的两难。

老黄内部邮件曝光:我们不做ASIC,就会被ASIC做掉,与其让对手赚走每一分钱,不如自己打自己,于是Groq被拉进英伟达怀抱,LPU改姓N,对外宣传“生态互补”,对内算盘啪啪响——把敌人变成儿子,就不算输。

知情人士透露,英伟达内部已启动“Project Lancer”,目标是在2026年推出基于Groq架构的NVIDIA LPU,直接嵌入Blackwell推理服务器。这招很老辣:既用Groq技术满足客户对低延迟的需求,又绑定自家软件栈,防止生态分裂。但风险在于,如果客户发现英伟达的LPU比原版Groq贵50%,还会买单吗?

但儿子也会叛逆:非独家授权意味着Groq还能继续服务亚马逊、谷歌,今天叫你爸爸,明天就喊别人亲爱的,英伟达这200亿更像高昂彩礼,新娘还能继续约会前男友,绿得发光,投资者问“溢价逻辑在哪”,老黄只能摊手“爱情的事,能用钱算吗”。



非独家授权是这笔交易最诡异的部分
按理说,花200亿应该买断技术,防止对手崛起。但英伟达偏偏选择“共享”,说明它真正要的是人,而不是IP。Groq的创始团队才是核心资产,他们脑子里的架构思想、微架构设计经验,才是英伟达急需的“活地图”。至于技术本身?反正客户用Groq越多,越证明ASIC路线正确——而英伟达已经入场了。

更深黑洞在软件:CUDA护城河宽到能停航母,但ASIC不需要CUDA,人家直接上编译器,一键把PyTorch烤成机器码,工程师凌晨两点在Reddit哀嚎“老子学CUDA十年,被一行LLVM打回解放前”,点赞破万,老黄半夜刷帖,默默点了个“踩”。

ASIC的软件栈轻得可怕:没有驱动、没有复杂调度、没有兼容层,模型一编译就烧进芯片。这意味着CUDA那套“学十年才能精通”的生态优势,在推理场景下几乎归零。更可怕的是,像MLIR、TVM、Apache TVM这些开源编译器正在让ASIC部署变得像pip install一样简单。

GPU软件护城河,正在被开源工具一点点填平。



再聊客户心理:训练阶段大家挤破头抢H100,像抢茅台;推理阶段客户秒变菜市场大妈,左手掐功耗,右手捏价格,嘴里念叨“够用就行”,ASIC顺势摆摊“新鲜便宜咯”,GPU摊位门可罗雀,老黄亲自下场吆喝“买GPU送CUDA”,大妈翻白眼“送我也得交电费”。

云厂商的KPI不是“用了多少最强芯片”,而是“每瓦性能提升多少”“每推理请求成本下降多少”。在这个指标下,GPU就是奢侈品,ASIC才是刚需。英伟达再吹“生态整合”,也抵不过财报里那一行“电力成本同比上升23%”带来的董事会压力。



有人喊“英伟达要完”?
别闹,训练市场还是它家后花园,H100仍是AI界的硬通货,只是后花园再大也挡不住推理前线塌方,老黄一边用GPU数钱,一边用ASIC补墙,双线作战,比拍复仇者联盟还烧脑,投资人天天追剧,股价过山车拉到颈椎错位。

英伟达的真正优势在于:它仍然掌控着AI训练的命脉。没有H100,你连大模型都训不出来,更别说部署。

所以短期看,老黄不会倒。但长期看,推理市场将决定AI基础设施的最终格局。如果英伟达不能在这块市场守住50%份额,它的“AI全栈霸主”人设就会崩塌。



硅谷猎头最开心:Groq团队整体跳槽,package直接按“小目标”发,连前台都拿到NVDA股票,湾区房租应声再涨5%,房东们举杯“感谢老黄送温暖”,工程师们凌晨排队买Tesla,销售小哥贴心附赠“自动驾驶用ASIC更快哦”,英伟达听完只想把Tesla也收购了。

人才战争才是这场博弈的核心。Groq团队不到50人,但人均产出价值可能超过10亿美元。英伟达用股票+现金+项目主导权三重诱惑,把这支“特种部队”完整收编。未来半年,硅谷将看到一波ASIC架构师薪资暴涨潮,而英伟达,成了最大推手。

再把镜头拉远,整个半导体江湖进入“大逃杀”:博通暗搓搓给FAANG造刀,AMD狂推MI300,英特尔抱政府大腿发补贴,老黄一人单挑全世界,背景音乐响起“孤勇者”,弹幕飘过“75%毛利率才是真的勇”。

但现实是,没有永远的赢家。GPU靠通用性和生态赢了第一局,ASIC靠专用性和性价比扳回一城。
下一局,可能是存算一体、光子计算、甚至量子芯片。
.老黄清楚得很:今天200亿买Groq,不是为了赢现在,而是为了活到下一局



200亿美元交易里还藏着彩蛋:Groq两位创始人曾是谷歌TPU灵魂人物,老黄把敌人老巢连根拔,相当于曹操花重金把关羽赵云挖到魏国,蜀汉集体懵逼,谷歌TPU部门连夜加薪留人,内部群公告“英伟达抢人啦,大家别去看股票,越看越心动”。这场人才争夺战,本质上是对AI未来话语权的争夺。

谁掌握了推理芯片的定义权,谁就掌握了AI落地的节奏。老黄不愿把节奏交给别人。

推理战场胜负手在“功耗÷延迟÷价格”,GPU像全能SUV,能拉货能越野,但送外卖还是电瓶车划算,ASIC就是这辆电瓶车,不能搬家不能载人,可送一单只烧一毛电费,平台抽成还低,外卖小哥们(云厂商)集体换车,SUV经销商英伟达只能推出“官方改装电瓶套件”,200亿美元买的就是这套件图纸。

这个比喻或许粗糙,但无比真实。AI的未来不在实验室,而在数据中心的电费账单里。谁能更省电、更便宜、更稳定,谁就赢。



散户最爱问“还能不能抄底NVDA”?
分析师撕掉旧报告,新建空白PPT,第一页写“Depends”,第二页画毛利率滑梯,第三页直接留白,意思是你敢赌老黄再造护城河就冲,不敢就躲,毕竟75%到55%只差两个季度,市盈率从60到40就是一夜腰斩,心脏不好别玩。

投资英伟达,现在不是投技术,是投信仰。信老黄能再造一个护城河,就继续;不信,就跑。

总结
最后:Groq官网偷偷把“Powered by Groq”换成“Accelerated by NVIDIA Groq™”,字体还加绿,环保又护眼,网友截图疯传“被收购后第一件事就是改Logo”,老黄转发并附言“绿色代表毛利率”,吃瓜群众笑疯,市值蒸发200亿也要把梗玩到底,硅谷理工男的幽默你学不会。

这场收购,表面是技术整合,内里是战略投降,但老黄硬是把它演成了一场胜利巡游。

这就是硅谷:真相不重要,叙事才重要。

毒鸡汤:技术世界没有永恒皇帝,只有永恒卷王,GPU称王十年,ASIC来踢馆,指不定明天量子芯片又把ASIC拍在沙滩,投资者、工程师、用户都是时代浪花,200亿美元只是老黄给浪花买的保险,浪花们继续卷,卷到摩尔定律都喊“累了”。