最近AI算力圈里有个超级大趋势,可能很多人还没意识到,但它已经悄悄点燃了一家叫CRDO(科多)公司的巨大机会。这家公司你可能没听过,但它的技术,正在成为英伟达下一代GPU集群——特别是Rubin架构下的NVL144高密度机柜——不可或缺的“血管”。
先说重点:英伟达正在疯狂推高GPU机柜的密度。什么叫高密度?就是在一个标准机柜里塞进更多GPU,比如NVL144,意思就是144个GPU堆在一个机架里!这可不是随便堆堆就行的,背后是整套互联架构的革命。而在这场革命里,传统的光模块正在被一种叫“AEC”的铜缆技术狠狠挑战,甚至可能被取代。
那AEC到底是什么?AEC全名叫Active Electrical Cable,中文叫“有源铜缆”。别被名字吓到,其实它就是一根“聪明的铜线”——里面是实打实的铜导体,两端加了硅基的重定时器(retimer)和数字信号处理器(DSP)。听起来技术味很浓?没关系,我们拆开说。
首先,为什么高密度机柜对CRDO是利好?因为GPU越挤,它们之间的连接距离就越短。而铜缆有个天然限制:传输距离短。但恰恰在高密度场景下,这个“缺点”反而成了“优点”!因为GPU挨得近,铜缆完全够用,而且比光模块便宜、稳定、好维护。
再来看光模块的问题。传统光互联依赖激光器、光纤、精密对准,制造精度要达到微米级别,对温度极其敏感,稍微热一点信号就衰减,稍微歪一点就断连。而且光模块是模拟器件,信号处理复杂,故障率高,成本也高。在AI数据中心这种7×24小时满负荷运转的环境里,稳定性就是生命线,光模块的“娇气”成了大问题。
反观AEC——有源铜缆,完全是另一套逻辑。它用的是数字信号传输,不是模拟;它没有激光器,没有光学元件,不需要机械对准;它靠的是铜导体+芯片组合,热稳定性极强,还能自我纠错。什么叫“自我纠错”?就是DSP芯片能实时检测信号质量,自动补偿衰减,保证数据完整。这在高速互联里太关键了!
更重要的是,AEC的制造门槛比光模块低得多。光模块需要高精度光学组装线,良率难控,产能紧张;而AEC更像传统电路板+芯片的组合,供应链成熟,扩产快,成本结构更优。对于正在疯狂扩张AI算力的云厂商和超算中心来说,这简直是天赐良方。
现在回到CRDO这家公司。CRDO全名是Coherent Corp.(相干公司),2022年由II-VI公司收购Coherent后更名而来,是全球领先的光电子和先进材料巨头。但很多人不知道,CRDO不只是做光的,它在铜互连、高速连接器、信号完整性领域也有深厚积累。尤其是在AEC这条赛道上,CRDO凭借其在硅光、DSP、高速I/O方面的技术整合能力,已经切入英伟达生态链。
特别值得注意的是,英伟达最新发布的Rubin架构GPU,明确支持更短距离、更高带宽的铜缆互联方案。而NVL144这样的高密度机柜设计,本质上就是为AEC量身定制的。GPU之间距离可能只有几米甚至更短,这时候用铜缆不仅够用,还更可靠、更省电、更便宜。
你可能会问:那光模块是不是要被淘汰了?当然不是。
在长距离传输(比如跨机柜、跨机房)场景下,光还是不可替代的。但在机柜内部、GPU与GPU之间、GPU与交换机之间的“最后一米”,铜缆正在强势回归。
这叫“分层互联”——长距用光,短距用铜。而AI数据中心的80%连接,恰恰发生在“短距”范围内!
所以,CRDO的机会在哪里?就在于它能同时提供光和铜的解决方案,但更重要的是,它押注了AEC这条高增长赛道。随着Meta、微软、谷歌、亚马逊等大厂加速部署AI集群,对高密度、低成本、高可靠互联的需求爆炸式增长。CRDO作为少数能提供端到端高速互连方案的厂商,自然成为核心受益者。
再往深了说,AEC不只是线缆,它背后是一整套信号完整性、电源管理、热设计的系统工程。CRDO在这些底层技术上的积累,让它能提供从芯片到线缆到连接器的完整方案,而不是只卖一根线。这种系统级能力,才是它真正的护城河。
举个例子:在NVL144机柜里,144块GPU需要高速互联,每块GPU可能有多个NVLink或PCIe接口。如果全用光模块,不仅成本翻倍,散热压力巨大,故障点也多。而用AEC,铜缆本身导热好,功耗低,还能通过DSP动态调节功耗,整体系统更稳定。这对数据中心的PUE(能源使用效率)也是重大利好。
最后,我们聊聊趋势。AI算力军备竞赛已经进入“密度为王”的阶段。谁能在单位空间里塞进更多算力,谁就能赢。而高密度的前提,就是互联技术的革新。AEC正是这场革新的关键拼图。CRDO作为AEC生态的重要玩家,正站在风口之上。
别小看这一根铜线,它可能就是下一波AI基础设施浪潮中最不起眼却最关键的“隐形冠军”。