博通BCM78920以51.2Tb/s带宽、250纳秒超低延迟及多项AI/HPC专属技术,重新定义高性能网络交换标准。
在当今这个算力为王的时代,人工智能和高性能计算已经不再是实验室里的概念,而是推动整个科技世界前进的核心引擎。而在这背后,有一颗默默无闻却至关重要的“心脏”——它就是博通公司最新推出的BCM78920系列超低延迟以太网交换芯片。这款芯片专为AI扩展和高性能计算(HPC)量身打造,堪称网络基础设施领域的一次革命性突破。
首先,让我们从最直观的性能说起:
BCM78920系列交换芯片的单芯片带宽高达51.2太比特每秒(Tb/s),这个数字是什么概念?简单来说,它可以在一秒钟内传输超过6400部高清电影。更惊人的是,它支持64个800千兆以太网端口、128个400千兆端口,或者256个200千兆端口,灵活适配各种规模的AI集群和超算系统。无论你是搭建一个256台加速器(XPU)的小型AI训练集群,还是构建一个覆盖多层架构的超大规模HPC系统,BCM78920都能轻松胜任。
说到延迟,这可是AI和HPC系统最敏感的指标之一。BCM78920实现了惊人的250纳秒端到端延迟,这几乎已经逼近物理极限。要知道,在传统数据中心交换机中,延迟动辄几微秒甚至更高,而BCM78920直接把延迟压缩到了四分之一微秒,这意味着数据包几乎“瞬间”就能从一端传到另一端。对于需要频繁进行参数同步的分布式AI训练任务,比如AllReduce操作,这种超低延迟带来的性能提升是指数级的。
那么,博通是怎么做到这一点的呢?
答案就在它集成的106.25G PAM-4 SerDes核心。
这个技术名词听起来很专业,但其实可以理解为芯片内部的“高速数据高速公路”。PAM-4是一种先进的信号调制方式,能在同样的物理通道上传输两倍的数据量,而106.25G则代表每条通道的速率。博通不仅采用了这项技术,还将其优化到极致,使得直连铜缆(DAC)的传输距离可达5米,同时支持线性可插拔光模块(LPO),大幅降低光模块的功耗和成本。这对于大规模部署的数据中心来说,意味着更低的总体拥有成本和更高的能效比。
当然,光有速度还不够,可靠性同样关键。BCM78920引入了一项名为“链路层重传”(Link Layer Retransmission,简称LLR)的创新功能。传统网络一旦出现链路错误,往往需要上层协议介入重传,耗时又耗力。而LLR则直接在硬件层面自动检测并修复错误,整个过程无需软件干预,不仅提升了系统稳定性,还显著减少了因链路抖动导致的训练中断。对于7×24小时不间断运行的AI训练任务来说,这种“自愈”能力简直是救命稻草。
此外,BCM78920还支持“基于信用的流量控制”(Credit-Based Flow Control,CBFC)。这项技术听起来有点抽象,但它的作用非常实在:在高负载情况下,传统网络容易因为缓冲区溢出而丢包,进而触发重传,造成性能雪崩。而CBFC通过预先分配“信用额度”,确保每个数据流都有足够的带宽和缓冲空间,从而实现无阻塞、无丢包的极致传输。即使在满负荷运行状态下,系统依然能保持稳定高效,这对于处理海量小数据包的HPC应用尤为重要。
说到小数据包,BCM78920还有一个杀手锏:
它能以51.2Tb/s的全线速处理64字节的小数据包,并且每秒可处理超过760亿个数据包(76 Bpps)。这在业内是极为罕见的。要知道,大多数交换芯片在处理小包时性能会大幅下降,因为包头开销占比太高。但BCM78920通过支持“AI Fabric Headers”(AI织构报头,简称AFH),将传统以太网报头压缩至仅10到12字节,极大降低了网络开销。这意味着更多的带宽可以用于实际数据传输,而不是浪费在协议头上传输上。
更酷的是,BCM78920还在芯片内部集成了“网内集合”(In-Network Collectives,INC)硬件加速引擎。像AllReduce、Broadcast、Scatter这类集合通信操作,原本需要多个节点反复交换数据,耗时耗力。现在,这些操作可以直接在交换芯片内部完成,无需数据离开网络设备。这不仅大幅减少了通信延迟,还释放了主机CPU的计算资源,让GPU或XPU能更专注于模型训练本身。
不仅如此,BCM78920还具备“拓扑感知路由”能力,能够智能识别并优化Mesh(网状)、Torus(环面)和Dragonfly(蜻蜓)等高级HPC网络拓扑结构。这些拓扑在超算系统中非常常见,但传统交换机往往无法充分利用其结构优势。而BCM78920则能根据实际网络布局动态调整路由策略,确保数据走最短、最高效的路径,进一步提升整体系统吞吐量。
值得一提的是,尽管BCM78920拥有如此多的定制化功能,但它依然完全兼容标准以太网协议。这意味着它可以无缝接入现有的数据中心网络,无需对终端设备或上层应用做任何修改。这种“向前兼容、向后增强”的设计理念,让客户既能享受最新技术红利,又不必承担高昂的迁移成本。
最后,我们不得不提一下背后的公司——博通(Broadcom Inc.)。作为全球领先的半导体和基础设施软件解决方案提供商,博通在数据中心、网络通信和企业存储等领域拥有深厚的技术积累。其StrataXGS Tomahawk系列交换芯片早已成为行业标杆,而BCM78920正是这一传奇系列的最新成员。它不仅继承了Tomahawk家族的高性能基因,更针对AI和HPC场景进行了深度优化,堪称“为未来而生”的网络芯片。
总而言之,BCM78920不仅仅是一颗交换芯片,它代表了一种全新的网络范式——低延迟、高可靠、高效率、高智能。在AI大模型训练动辄需要数千张GPU、通信开销成为瓶颈的今天,BCM78920的出现,无疑为整个行业注入了一剂强心针。
它让“算力无损互联”从口号变成了现实,也让更大规模、更复杂的AI系统成为可能。