机架功率太高逼着GPU分家
AI训练那种大机架,原来所有GPU塞一个柜子里用纯铜线连。现在单个柜子功率冲到100多千瓦,老数据中心根本扛不住。所以厂家把GPU拆到两个柜子里。两个柜子之间需要连起来,距离大概3米。纯铜线够不着这个距离。光模块和那种带DSP芯片的铜缆又太费电。中间有个不大不小的坑,有源铜缆正好填上。这个新需求给 interconnect 行业打开了一个新市场。
咱们得先把AI数据中心里各种连接线搞清楚。你想象一下,机架里密密麻麻都是线。英伟达NVIDIA的NVLink背板里面大概塞了5000根铜缆。这些铜缆大部分是无源纯铜线,也叫DAC。为什么能用纯铜线?因为在一个柜子内部,线很短。短到什么程度呢?Hopper那代每根线跑100G,纯铜线能撑3米,一个柜子里够用了。
英伟达Blackwell那代每根线跑到200G,纯铜线距离缩短到1.5到2米。NVIDIA还是把所有72个GPU和交换机塞一个柜子里,线还是够长。Rubin那代官方说400G每根线,实际是200G双向同时跑,这种玩法对线要求更高,但柜子内部纯铜线依然能活。
柜子之间连就不一样了。一整排机架要连起来需要真距离,那就要用有源电缆,里面带芯片那种。Credo公司靠这个火过一阵。Marvell和Astera Labs也做这个芯片。速度再往上,柜间连接就往光模块迁移了,先是用可插拔光模块,以后用共封装光学。跨园区连数据中心,光模块已经是标配。
现在出现一个新夹缝。原来一个柜子里的scale-up网络,因为功率太高被拆到两个柜子。柜间距离正好3米左右。光模块和带DSP的有源电缆跑这个距离太浪费电。有源铜缆就是针对这个夹缝设计的。
纯铜线在单柜内部依然能打
咱们先夸夸纯铜线有多好。便宜。延迟几乎为零。几乎不耗电。这就是为什么所有云厂商都想把所有GPU塞一个柜子里。一个柜子搞定所有scale-up连接,省钱省事。纯铜线能做到这些,是因为它里面就是一根铜导线,没有芯片。信号从一头进去,另一头出来,中间不做任何处理。
但是速度一高,问题就来了。电信号在铜线上跑会衰减。速度越高,衰减越快。200G每根线的时候,纯铜线大概1.5米后信号就没法看了。NVIDIA Blackwell NVL72那个柜子,内部最长的线控制在1.5米以内,所以还能用。柜子设计得像艺术品一样紧凑,就是为了迁就纯铜线的距离限制。
英伟达Rubin那代玩了个花活。200G双向同时跑,相当于一根线同时发和收。这个技术叫BiDi。它需要更强的回波抵消技术,对铜线的要求也更严格。但核心还是纯铜线。Rubin Ultra更绝,直接换成背板PCB,那还是纯铜,只不过把铜线印在电路板上了。
所以纯铜线没死。它只是在单柜内部继续苟着。一旦跨出柜子,它就不行了。
Meta Catalina被迫把GPU分成两柜
Meta的Catalina机架是个经典案例:NVIDIA Blackwell NVL72单柜功耗大概120到130千瓦。大部分老数据中心单柜只能扛60到70千瓦。你直接把NVIDIA的柜子搬进去,人家机房会跳闸。Meta自己的开放机架第三代高功率版单柜能扛93.5千瓦,也扛不住120千瓦。
那怎么办?两条路。
第一条,把老数据中心所有机架全换成NVIDIA那种能扛120千瓦的。这相当于把房子拆了重盖,贵得离谱。
第二条,把72个GPU拆到两个柜子里,每个柜子大概36个GPU,功耗降到67千瓦左右。这样每个柜子都在93.5千瓦的范围内,Meta现有的供电和散热系统不用改。
Meta选了第二条,这就是Catalina机架。
你仔细品这个操作:GPU还是NVIDIA的,但柜子是Meta自己攒的。这样Catalina能直接塞进Meta现有的数据大厅,不用新建机房。代价就是scale-up网络必须跨两个柜子跑。
两个柜子之间需要多少根线?算一下。每个柜子里有9个NVLink交换机,每个交换机有18个口。两个柜子之间要保证72个GPU无阻塞通信,需要162根跨柜线。这些线不需要跑一整排机架那么远,只需要跑到隔壁柜子就行。算上走线和余量,大概3米。
这个3米很关键。纯铜线够不着。光模块和带DSP的线又太浪费。正好卡在中间。
三米距离有源铜缆刚刚好
咱们把选项一个个过一遍:
第一个出局的是纯铜线。200G每根线的时候,纯铜线撑不到3米。信号衰减太厉害,误码率高到你没法用。
第二个选项是带DSP的有源电缆。DSP芯片会把进来的信号完全重新整理一遍,再发出去。这样能跑很远,几十米都没问题。但代价是一端耗电20瓦左右,还有不小的延迟。你就跑个3米,花40瓦电和额外延迟,太冤了。
第三个选项是可插拔光模块。光模块也能轻松跑3米,甚至跑几公里都行。但一个光模块也是一端耗电十几到二十几瓦。而且光模块里面有激光器,有驱动芯片,有控制电路,复杂得很。为了3米距离搞这么复杂,就像开卡车去买菜。
第四个选项是共封装光学。就是把光引擎直接和交换芯片封在一起。这个功耗最低,也最未来。NVIDIA在Rubin Ultra上推这个方案。但问题是这东西还没大规模验证过,而且绑死了少数几个供应商的生态。现在1.6T这代大规模部署还不太现实。除了共封装光学,还有几个厂家在研究microLED和VCSEL做短距离光互连,但都还没大规模出货。
最后一个选项就是有源铜缆。它在铜线两端各加一个线性红river芯片。这个芯片不做完整信号恢复,只是把衰减的信号稍微拉高一点再送出去。功耗每端只有几瓦,延迟几乎可以忽略不计。它能帮铜线在200G每根线的情况下撑到3米。有源铜缆的功耗比带DSP的线低一个数量级,距离又比纯铜线远一倍。对于3米这个距离,它就是金发姑娘选择,不大不小刚刚好。
有源铜缆的生意逻辑很清楚
你从产业链角度看。原来卖无源铜缆的厂家,现在需要在线上加芯片。芯片厂家看到新机会。线缆组装厂也需要新工艺。整个 interconnect 供应链被机架功率密度这个物理限制推着往前走。
数据中心运营商的算盘更简单。我不想改机房配电。我不想改散热。我甚至不想换机架。我只想把新买的GPU塞进去。如果单个机架功率不够,我就拆成两个机架。拆开之后需要线连起来。这根线不能太贵,不能太耗电,延迟不能太高。有源铜缆正好满足。
从技术代际看,1.6T这代有源铜缆会吃下这个市场。再下一代3.2T,有源铜缆能不能继续撑住不好说,可能会被共封装光学或其它短距光技术替代。但那也是好几年后的事。眼下这个窗口,有源铜缆是唯一合理的选择。
你看Meta Catalina那个图里,两个柜子之间那捆粗粗的黑线,里面就是一百多根有源铜缆。这不是实验室原型。这是已经在HotChips 2025上公布的真实部署。Meta不是唯一这么干的。其他超大规模云厂商也在做类似的事。当单个机架功率天花板撞上GPU功耗增长曲线,拆机架就成了唯一现实的选择。每拆一次,就需要一批有源铜缆。
这个市场的规模可以大致估算。假设一个超大规模数据中心有一万个GPU。按72个GPU一组,大概需要140组。每组拆成两个机架,需要大概140套跨柜连接。每套跨柜连接需要一百多根有源铜缆。那就是一万五千根左右的量级。再乘以每个数据中心,再乘以全球几十个超大规模数据中心。这是个每年几亿美元的新市场,而且还在增长。
有源铜缆的单价虽然比无源铜缆贵,但比光模块便宜得多。对运营商来说,每根线省几十美元,一个数据中心就能省几十万美元。再加上省下来的电费,账很容易算过来。这就是为什么有源铜缆不是个技术噱头,而是个真金白银的生意。
A股有源铜缆上下游
有源铜缆A股产业链分三层:上游材料、中游线缆组件、下游芯片/方案。
A股公司主要在三个环节:上游的镀银铜导体材料,中游的高速通信线和AEC成品,下游的连接器模组和整体方案。
市场从DAC往AEC转,A股跟得挺紧
AI服务器柜间连接从无源铜缆DAC往有源铜缆AEC转,这个趋势在A股已经反映出来了。Credo、Marvell财报一出来,博创科技直接20%涨停,瑞可达、兆龙互连、沃尔核材跟着大涨。
产业链逻辑很清楚:柜子拆开之后需要3米以上连接,DAC够不着,光模块太贵,AEC正好。