博通以太网交换芯片重定义高性能网络交换标准

博通BCM78920以51.2Tb/s带宽、250纳秒超低延迟及多项AI/HPC专属技术，重新定义高性能网络交换标准。

在当今这个算力为王的时代，人工智能和高性能计算已经不再是实验室里的概念，而是推动整个科技世界前进的核心引擎。而在这背后，有一颗默默无闻却至关重要的“心脏”——它就是博通公司最新推出的BCM78920系列超低延迟以太网交换芯片。这款芯片专为AI扩展和高性能计算（HPC）量身打造，堪称网络基础设施领域的一次革命性突破。

首先，让我们从最直观的性能说起：
BCM78920系列交换芯片的单芯片带宽高达51.2太比特每秒（Tb/s），这个数字是什么概念？简单来说，它可以在一秒钟内传输超过6400部高清电影。更惊人的是，它支持64个800千兆以太网端口、128个400千兆端口，或者256个200千兆端口，灵活适配各种规模的AI集群和超算系统。无论你是搭建一个256台加速器（XPU）的小型AI训练集群，还是构建一个覆盖多层架构的超大规模HPC系统，BCM78920都能轻松胜任。

说到延迟，这可是AI和HPC系统最敏感的指标之一。BCM78920实现了惊人的250纳秒端到端延迟，这几乎已经逼近物理极限。要知道，在传统数据中心交换机中，延迟动辄几微秒甚至更高，而BCM78920直接把延迟压缩到了四分之一微秒，这意味着数据包几乎“瞬间”就能从一端传到另一端。对于需要频繁进行参数同步的分布式AI训练任务，比如AllReduce操作，这种超低延迟带来的性能提升是指数级的。

那么，博通是怎么做到这一点的呢？
答案就在它集成的106.25G PAM-4 SerDes核心。

这个技术名词听起来很专业，但其实可以理解为芯片内部的“高速数据高速公路”。PAM-4是一种先进的信号调制方式，能在同样的物理通道上传输两倍的数据量，而106.25G则代表每条通道的速率。博通不仅采用了这项技术，还将其优化到极致，使得直连铜缆（DAC）的传输距离可达5米，同时支持线性可插拔光模块（LPO），大幅降低光模块的功耗和成本。这对于大规模部署的数据中心来说，意味着更低的总体拥有成本和更高的能效比。

当然，光有速度还不够，可靠性同样关键。BCM78920引入了一项名为“链路层重传”（Link Layer Retransmission，简称LLR）的创新功能。传统网络一旦出现链路错误，往往需要上层协议介入重传，耗时又耗力。而LLR则直接在硬件层面自动检测并修复错误，整个过程无需软件干预，不仅提升了系统稳定性，还显著减少了因链路抖动导致的训练中断。对于7×24小时不间断运行的AI训练任务来说，这种“自愈”能力简直是救命稻草。

此外，BCM78920还支持“基于信用的流量控制”（Credit-Based Flow Control，CBFC）。这项技术听起来有点抽象，但它的作用非常实在：在高负载情况下，传统网络容易因为缓冲区溢出而丢包，进而触发重传，造成性能雪崩。而CBFC通过预先分配“信用额度”，确保每个数据流都有足够的带宽和缓冲空间，从而实现无阻塞、无丢包的极致传输。即使在满负荷运行状态下，系统依然能保持稳定高效，这对于处理海量小数据包的HPC应用尤为重要。

说到小数据包，BCM78920还有一个杀手锏：
它能以51.2Tb/s的全线速处理64字节的小数据包，并且每秒可处理超过760亿个数据包（76 Bpps）。这在业内是极为罕见的。要知道，大多数交换芯片在处理小包时性能会大幅下降，因为包头开销占比太高。但BCM78920通过支持“AI Fabric Headers”（AI织构报头，简称AFH），将传统以太网报头压缩至仅10到12字节，极大降低了网络开销。这意味着更多的带宽可以用于实际数据传输，而不是浪费在协议头上传输上。

更酷的是，BCM78920还在芯片内部集成了“网内集合”（In-Network Collectives，INC）硬件加速引擎。像AllReduce、Broadcast、Scatter这类集合通信操作，原本需要多个节点反复交换数据，耗时耗力。现在，这些操作可以直接在交换芯片内部完成，无需数据离开网络设备。这不仅大幅减少了通信延迟，还释放了主机CPU的计算资源，让GPU或XPU能更专注于模型训练本身。

不仅如此，BCM78920还具备“拓扑感知路由”能力，能够智能识别并优化Mesh（网状）、Torus（环面）和Dragonfly（蜻蜓）等高级HPC网络拓扑结构。这些拓扑在超算系统中非常常见，但传统交换机往往无法充分利用其结构优势。而BCM78920则能根据实际网络布局动态调整路由策略，确保数据走最短、最高效的路径，进一步提升整体系统吞吐量。

值得一提的是，尽管BCM78920拥有如此多的定制化功能，但它依然完全兼容标准以太网协议。这意味着它可以无缝接入现有的数据中心网络，无需对终端设备或上层应用做任何修改。这种“向前兼容、向后增强”的设计理念，让客户既能享受最新技术红利，又不必承担高昂的迁移成本。

最后，我们不得不提一下背后的公司——博通（Broadcom Inc.）。作为全球领先的半导体和基础设施软件解决方案提供商，博通在数据中心、网络通信和企业存储等领域拥有深厚的技术积累。其StrataXGS Tomahawk系列交换芯片早已成为行业标杆，而BCM78920正是这一传奇系列的最新成员。它不仅继承了Tomahawk家族的高性能基因，更针对AI和HPC场景进行了深度优化，堪称“为未来而生”的网络芯片。

总而言之，BCM78920不仅仅是一颗交换芯片，它代表了一种全新的网络范式——低延迟、高可靠、高效率、高智能。在AI大模型训练动辄需要数千张GPU、通信开销成为瓶颈的今天，BCM78920的出现，无疑为整个行业注入了一剂强心针。

它让“算力无损互联”从口号变成了现实，也让更大规模、更复杂的AI系统成为可能。

博通以太网交换芯片重定义高性能网络交换标准

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道