AI基础设施、芯片和机器人

Cerebras上市：有人说它能干翻英伟达 | 定制架构的生死局

#AI基础设施 #AI人工智能指南 #芯片半导体 #AI投资新闻

2026-05-14 1 4K banq

算力怪兽Cerebras上市：快是真快，但别急着喊“显卡杀手”！Cerebras即将上市，其全定制芯片架构（晶圆级芯片）虽快但复杂。本文分析其技术优势、与OpenAI的独特算力交易、对G42的客户依赖，以及决定其能否规模化盈利的真正风险。

Cerebras这周搞IPO了，认购超了20倍。有人说它能干翻英伟达，有人说是下一个Groq。冷静一下：它的芯片有整个披萨那么大，快得像闪电。但为啥大厂不直接买它的机器，而是租它的算力？这里面藏着一个关于“全定制”的惊悚故事。

芯片大得像披萨所以推理飞快

先记住一个核心结论：Cerebras确实快，尤其在做AI推理的最后一步（解码）。但这种快是靠把整个晶圆做成一块芯片换来的。代价就是整条供应链从上到下都得定制，从硅片到插头全得自己造。这导致它很难大规模铺开，而且客户就靠两三个大佬撑着。

接下来我们一层层拆开看。

他们做了一块不切开的晶圆当作芯片

正常的芯片厂拿到一张300毫米的硅晶圆，会像切披萨一样切成几百个小块，每个小块就是一个芯片，比如英伟达的GPU。坏掉几个小块没关系，丢掉就行。

但Cerebras的做法非常狠：整张晶圆不切，直接当一块芯片用。这块芯片叫晶圆级引擎，第三代产品有90万个计算核心，自带44G的超高速内存（SRAM），内存带宽达到每秒2万1千兆字节（21PB/s）。

作为对比，Groq的单颗芯片带宽只有每秒几百兆字节。所以单纯比解码速度，Cerebras是头怪兽。

为什么解码需要这么高的带宽？因为AI推理分两步：第一步叫预填充，把整个问题塞进芯片，这活主要看算力。第二步叫解码，一个字一个字往外蹦答案，这活主要看内存有多快。就像开饭馆：预填充是备菜，考验刀工；解码是上菜，考验传菜员跑得多快。Cerebras的传菜员踩着火箭送餐。

这种快只在少数场景是刚需

但问题是，绝大多数AI应用不需要这种级别的火箭送餐。

你在对话框问个问题，等一两秒很正常。只有实时翻译、高频交易、自动驾驶这些场景才需要快到眨眼。今年2月的一份数据显示，市面上绝大部分推理计算压根没用上这种低延迟硬件。

就像你点个外卖，普通快递员半小时送到就够了，非派F1赛车去送，赛车手和轮胎都贵得要死。Cerebras就是那辆F1赛车。开起来很爽，但你不能让全城外卖都用赛车。

所以它不会干掉英伟达，也不会干掉Groq。大家各吃各的饭。英伟达管日常管饱，Groq管中等快，Cerebras管极端快。

全定制意味着被台积电牢牢绑定

Cerebras为了把整张晶圆做成芯片，跟台积电磨合了将近十年。普通芯片是一个个重复的小方块拼出来的，但晶圆级芯片需要把不同的小方块图案拼接成一张完整的大图，中间还要绕过那些坏掉的小块。

技术上怎么绕过的？他们在晶圆上实际做了一百万个核心，但只让你用九十万个，那十万个坏的直接被软件屏蔽掉，就像往有坑的路面上铺木板绕过去。

这个拼接工艺只有台积电愿意陪他们玩，也玩得转。如果台积电产能吃紧，或者下一代技术Cerebras跟不上，他们没有备用工厂可选。换个代工厂等于重来十年。

这就像你定制了一辆只有一家修理厂能修的车。修车师傅手艺好是好，但人家忙的时候你就得排队，涨价你也得忍着。

OpenAI不买机器只买算力这里面有陷阱

今年1月，OpenAI跟Cerebras签了个大单：未来三年部署750兆瓦的算力，总价值超过200亿美元，最多可以扩到2吉瓦直到2030年。

但你仔细看条款会发现：OpenAI并没有买Cerebras的硬件。Cerebras自己去建或者租数据中心，塞满自己的芯片，然后当成云服务卖给OpenAI。OpenAI按实际算力使用时间付钱。

这相当于什么？相当于你开了一家出租车公司，造了全世界最快的赛车，但没人肯买这辆车。于是你自己雇司机、租车库、接订单，然后告诉客户你付车费就行。

Groq之前也这么干过，被迫自己卖算力，直到后来被英伟达高价收购团队。Cerebras走老路的原因很简单：硬件本身不好卖。大厂不愿意被这种全定制芯片绑死。谁买回来都得重新写全套软件，还要伺候那套独一无二的供电和散热。

OpenAI先借了10亿美元但这笔钱不是白给的

这个交易还有一个更精妙的金融设计。

OpenAI借给Cerebras一笔10亿美元的流动资金贷款，年息6%。但如果Cerebras通过交付算力而不是直接还现金来还这笔贷款，利息全免。

翻译成人话：这就是一个伪装的预付款。OpenAI提前给钱让Cerebras去盖楼买芯片，Cerebras以后用算力抵债。如果Cerebras干不成，拿不出算力，那就老老实实还10亿美元加利息。

与此同时，OpenAI拿到了一份几乎免费的股权。Cerebras给了OpenAI一个认股权证，覆盖3300万股，行权价格是0.00001美元，基本等于白送。但这些股票要随着OpenAI真正采购算力才能逐步到手，干到2吉瓦才能全部拿完。

所以OpenAI既不是客户也不是股东，而是拴在Cerebras船上的战略伙伴。Cerebras越成功，OpenAI手里的股票越值钱。但反过来也一样：Cerebras的生死现在跟OpenAI的算力需求牢牢绑在一起。

剩下那八成收入全靠G42一家公司撑着

除了OpenAI这个算力大租户，Cerebras还有一个真正的硬件买家：阿联酋的G42公司，以及相关的MBZUAI大学。2025年的财报里，这两家贡献了86%的收入。

这是一个极度危险的比例。任何一家公司如果超过一半收入来自一个客户，审计报告里就要单独列出来。Cerebras接近九成。

万一G42明年换了供应商，或者阿联酋那边地缘政治一紧张，Cerebras的收入会直接腰斩。他们没有其他大客户排队等着买机器。

而且G42采购的是硬件，不是算力服务。这意味着Cerebras得提前生产、提前备货、压着库存。如果G42突然砍单，那些定制的插头、连接器、电源模块全砸手里，别人用不了。

投资者真正该问的不是它能不能干掉英伟达

现在所有媒体都在问：Cerebras会不会威胁英伟达？这个问题本身就问错了。

正确的问题是：这套全定制架构，能不能在不被某个单点故障卡死的情况下，把收入从OpenAI的几笔战略订单，扩大到真正的规模化市场？

这里藏着四个很少被讨论的风险。

第一，供应链单点。所有晶圆级芯片的拼接、封装、测试全压在台积电一家身上。台积电万一地震，或者优先给苹果英伟达排产，Cerebras直接停摆。

第二，运营黑洞。Cerebras以前是卖硬件的公司，现在突然要自己运营超大规模数据中心。他们从来没干过这事。从买地、拉电、散热、网络到日常运维，每一样都是烧钱的无底洞。

第三，客户天花板。目前愿意为这种极端快买单的客户，掰着手指头数得过来。金融高频交易、某些实时AI agent、国防相关。大部分企业不会为那点毫秒级提升多付五倍的钱。

第四，技术锁定的反噬。全定制听起来很酷，但意味着每次升级换代都要从头验证全套工艺。英伟达每两年换一代，台积电的标准工艺直接往上套。Cerebras每换一代，得重新验证整个晶圆级拼接方案，周期长、风险高。

上市不是终点而是放大镜

这周Cerebras上市，超20倍认购，看起来很火。但资本市场有个残酷的规律：上市会把所有优点和缺点同时放大。

优点是技术确实硬，推理确实快，专利墙确实高。缺点是客户集中、运营没经验、供应链脆弱、市场空间有限。

他们靠一套漂亮的金融结构和OpenAI绑定，拿到了短期现金流。但长期看，能不能从每年几十亿的定制单子，做到几百亿的标准市场，才是真正的分水岭。

简单总结一下：Cerebras的芯片是披萨大小的怪兽，快得离谱。但快不等于赢。在芯片行业，赢了生态才叫赢。英伟达赢在大家都会用他的工具，Groq赢在被英伟达看中收编。Cerebras现在赢在技术酷炫，但还没赢在生意好做。

上市之后，故事就不再是讲给投资人听了，而是要一台一台机器、一度电一度电地把算力卖出去。那才是真正的考验。