Cerebras这周搞IPO了,认购超了20倍。有人说它能干翻英伟达,有人说是下一个Groq。冷静一下:它的芯片有整个披萨那么大,快得像闪电。但为啥大厂不直接买它的机器,而是租它的算力?这里面藏着一个关于“全定制”的惊悚故事。
芯片大得像披萨所以推理飞快
先记住一个核心结论:Cerebras确实快,尤其在做AI推理的最后一步(解码)。但这种快是靠把整个晶圆做成一块芯片换来的。代价就是整条供应链从上到下都得定制,从硅片到插头全得自己造。这导致它很难大规模铺开,而且客户就靠两三个大佬撑着。
接下来我们一层层拆开看。
他们做了一块不切开的晶圆当作芯片
正常的芯片厂拿到一张300毫米的硅晶圆,会像切披萨一样切成几百个小块,每个小块就是一个芯片,比如英伟达的GPU。坏掉几个小块没关系,丢掉就行。
但Cerebras的做法非常狠:整张晶圆不切,直接当一块芯片用。这块芯片叫晶圆级引擎,第三代产品有90万个计算核心,自带44G的超高速内存(SRAM),内存带宽达到每秒2万1千兆字节(21PB/s)。
作为对比,Groq的单颗芯片带宽只有每秒几百兆字节。所以单纯比解码速度,Cerebras是头怪兽。
为什么解码需要这么高的带宽?因为AI推理分两步:第一步叫预填充,把整个问题塞进芯片,这活主要看算力。第二步叫解码,一个字一个字往外蹦答案,这活主要看内存有多快。就像开饭馆:预填充是备菜,考验刀工;解码是上菜,考验传菜员跑得多快。Cerebras的传菜员踩着火箭送餐。
这种快只在少数场景是刚需
但问题是,绝大多数AI应用不需要这种级别的火箭送餐。
你在对话框问个问题,等一两秒很正常。只有实时翻译、高频交易、自动驾驶这些场景才需要快到眨眼。今年2月的一份数据显示,市面上绝大部分推理计算压根没用上这种低延迟硬件。
就像你点个外卖,普通快递员半小时送到就够了,非派F1赛车去送,赛车手和轮胎都贵得要死。Cerebras就是那辆F1赛车。开起来很爽,但你不能让全城外卖都用赛车。
所以它不会干掉英伟达,也不会干掉Groq。大家各吃各的饭。英伟达管日常管饱,Groq管中等快,Cerebras管极端快。
全定制意味着被台积电牢牢绑定
Cerebras为了把整张晶圆做成芯片,跟台积电磨合了将近十年。普通芯片是一个个重复的小方块拼出来的,但晶圆级芯片需要把不同的小方块图案拼接成一张完整的大图,中间还要绕过那些坏掉的小块。
技术上怎么绕过的?他们在晶圆上实际做了一百万个核心,但只让你用九十万个,那十万个坏的直接被软件屏蔽掉,就像往有坑的路面上铺木板绕过去。
这个拼接工艺只有台积电愿意陪他们玩,也玩得转。如果台积电产能吃紧,或者下一代技术Cerebras跟不上,他们没有备用工厂可选。换个代工厂等于重来十年。
这就像你定制了一辆只有一家修理厂能修的车。修车师傅手艺好是好,但人家忙的时候你就得排队,涨价你也得忍着。
OpenAI不买机器只买算力 这里面有陷阱
今年1月,OpenAI跟Cerebras签了个大单:未来三年部署750兆瓦的算力,总价值超过200亿美元,最多可以扩到2吉瓦直到2030年。
但你仔细看条款会发现:OpenAI并没有买Cerebras的硬件。Cerebras自己去建或者租数据中心,塞满自己的芯片,然后当成云服务卖给OpenAI。OpenAI按实际算力使用时间付钱。
这相当于什么?相当于你开了一家出租车公司,造了全世界最快的赛车,但没人肯买这辆车。于是你自己雇司机、租车库、接订单,然后告诉客户你付车费就行。
Groq之前也这么干过,被迫自己卖算力,直到后来被英伟达高价收购团队。Cerebras走老路的原因很简单:硬件本身不好卖。大厂不愿意被这种全定制芯片绑死。谁买回来都得重新写全套软件,还要伺候那套独一无二的供电和散热。
OpenAI先借了10亿美元 但这笔钱不是白给的
这个交易还有一个更精妙的金融设计。
OpenAI借给Cerebras一笔10亿美元的流动资金贷款,年息6%。但如果Cerebras通过交付算力而不是直接还现金来还这笔贷款,利息全免。
翻译成人话:这就是一个伪装的预付款。OpenAI提前给钱让Cerebras去盖楼买芯片,Cerebras以后用算力抵债。如果Cerebras干不成,拿不出算力,那就老老实实还10亿美元加利息。
与此同时,OpenAI拿到了一份几乎免费的股权。Cerebras给了OpenAI一个认股权证,覆盖3300万股,行权价格是0.00001美元,基本等于白送。但这些股票要随着OpenAI真正采购算力才能逐步到手,干到2吉瓦才能全部拿完。
所以OpenAI既不是客户也不是股东,而是拴在Cerebras船上的战略伙伴。Cerebras越成功,OpenAI手里的股票越值钱。但反过来也一样:Cerebras的生死现在跟OpenAI的算力需求牢牢绑在一起。
剩下那八成收入全靠G42一家公司撑着
除了OpenAI这个算力大租户,Cerebras还有一个真正的硬件买家:阿联酋的G42公司,以及相关的MBZUAI大学。2025年的财报里,这两家贡献了86%的收入。
这是一个极度危险的比例。任何一家公司如果超过一半收入来自一个客户,审计报告里就要单独列出来。Cerebras接近九成。
万一G42明年换了供应商,或者阿联酋那边地缘政治一紧张,Cerebras的收入会直接腰斩。他们没有其他大客户排队等着买机器。
而且G42采购的是硬件,不是算力服务。这意味着Cerebras得提前生产、提前备货、压着库存。如果G42突然砍单,那些定制的插头、连接器、电源模块全砸手里,别人用不了。
投资者真正该问的不是 它能不能干掉英伟达
现在所有媒体都在问:Cerebras会不会威胁英伟达?这个问题本身就问错了。
正确的问题是:这套全定制架构,能不能在不被某个单点故障卡死的情况下,把收入从OpenAI的几笔战略订单,扩大到真正的规模化市场?
这里藏着四个很少被讨论的风险。
第一,供应链单点。所有晶圆级芯片的拼接、封装、测试全压在台积电一家身上。台积电万一地震,或者优先给苹果英伟达排产,Cerebras直接停摆。
第二,运营黑洞。Cerebras以前是卖硬件的公司,现在突然要自己运营超大规模数据中心。他们从来没干过这事。从买地、拉电、散热、网络到日常运维,每一样都是烧钱的无底洞。
第三,客户天花板。目前愿意为这种极端快买单的客户,掰着手指头数得过来。金融高频交易、某些实时AI agent、国防相关。大部分企业不会为那点毫秒级提升多付五倍的钱。
第四,技术锁定的反噬。全定制听起来很酷,但意味着每次升级换代都要从头验证全套工艺。英伟达每两年换一代,台积电的标准工艺直接往上套。Cerebras每换一代,得重新验证整个晶圆级拼接方案,周期长、风险高。
上市不是终点而是放大镜
这周Cerebras上市,超20倍认购,看起来很火。但资本市场有个残酷的规律:上市会把所有优点和缺点同时放大。
优点是技术确实硬,推理确实快,专利墙确实高。缺点是客户集中、运营没经验、供应链脆弱、市场空间有限。
他们靠一套漂亮的金融结构和OpenAI绑定,拿到了短期现金流。但长期看,能不能从每年几十亿的定制单子,做到几百亿的标准市场,才是真正的分水岭。
简单总结一下:Cerebras的芯片是披萨大小的怪兽,快得离谱。但快不等于赢。在芯片行业,赢了生态才叫赢。英伟达赢在大家都会用他的工具,Groq赢在被英伟达看中收编。Cerebras现在赢在技术酷炫,但还没赢在生意好做。
上市之后,故事就不再是讲给投资人听了,而是要一台一台机器、一度电一度电地把算力卖出去。那才是真正的考验。