OCP联合十二家科技巨头启动ESUN项目,旨在通过开放标准将以太网升级为AI扩展型网络的主流方案,解决大规模AI训练中的通信瓶颈。
在AI狂飙突进的时代,算力就是新石油,而网络就是输送石油的管道。
2025年10月13日,全球最具影响力的开放硬件组织——开放计算项目基金会(Open Compute Project Foundation,简称OCP)在刚刚落幕的OCP全球峰会上,正式宣布启动一个名为“ESUN”(以太网用于扩展型AI网络,Ethernet for Scale-Up Networking)的全新工作流项目。这一消息犹如一颗重磅炸弹,在AI基础设施圈掀起轩然大波。为什么?因为ESUN瞄准的,正是当前AI大模型训练中最卡脖子、最烧钱、最复杂的“扩展型互联”难题——如何让成千上万个AI加速芯片(XPU)高效、低延迟、无损地协同工作。
要知道,今天的AI训练早已不是单卡单机时代。像Meta、微软、OpenAI这些巨头动辄部署上万张GPU甚至专用AI芯片,组成超大规模集群。但问题来了:这些芯片之间怎么“说话”?如果通信效率低下,再强的算力也会被网络拖垮。
目前主流方案要么依赖昂贵且封闭的InfiniBand,要么用传统以太网硬扛,但传统以太网在高吞吐、零丢包、低延迟这些关键指标上根本扛不住AI训练的极端压力。于是,ESUN应运而生——它要做的,就是把以太网彻底改造升级,让它成为AI扩展型网络的“黄金标准”。
这个项目可不是某个小团队的自嗨,而是由AMD、Arista(阿瑞斯塔)、ARM、博通(Broadcom)、思科(Cisco)、慧与网络(HPE Networking)、美满电子(Marvell)、Meta、微软、英伟达(NVIDIA)、OpenAI和甲骨文(Oracle)这十二家行业巨头联合发起。你没看错,几乎囊括了从芯片设计、网络设备、云服务商到AI模型公司的全产业链顶级玩家。这意味着什么?意味着ESUN不是纸上谈兵,而是即将落地的行业共识。这些公司愿意放下竞争,坐在一起制定开放标准,本身就说明:AI基础设施的网络瓶颈已经到了非解决不可的地步。
那么,ESUN到底要做什么?简单说,它聚焦两大核心方向。
第一个是“网络功能层”,也就是数据如何在交换机之间高效、无损地传输。这包括协议头设计、错误处理机制、流量控制策略,目标是实现真正意义上的“零丢包”以太网,哪怕在多跳(multi-hop)复杂拓扑下也能稳如泰山。
第二个方向其实是它的“兄弟项目”——SUE-T(扩展型以太网传输,Scale-up Ethernet Transport),它专注的是XPU端点侧的功能,比如内存一致性、负载均衡、任务分区等,这部分往往需要和芯片架构深度协同。
而ESUN明确划清界限:我们只管网络交换和帧结构,不管主机协议栈、应用层逻辑,更不碰非以太网技术或私有协议。这种“专注做一件事并做到极致”的思路,正是OCP一贯的工程哲学。
值得一提的是,ESUN并非闭门造车。它将积极与超以太网联盟(UEC)和IEEE 802.3标准组织对接,确保其技术方案既能快速落地,又能融入全球以太网生态。毕竟,以太网最大的优势就是成熟、开放、成本低。如果能在这个基础上叠加AI所需的高性能特性,那将是整个行业的福音——不仅巨头受益,中小企业也能用得起高效AI集群。
说到OCP,可能很多人还不熟悉,但它其实是推动全球数据中心革新的隐形引擎。OCP由Facebook(现Meta)在2011年发起,初衷是把超大规模数据中心的设计开源,让所有人受益。十几年来,它催生了无数创新:从整机柜服务器、液冷散热,到开放光模块和AI加速器架构。如今,全球几乎所有云厂商和大型互联网公司都是OCP成员。而这次ESUN的启动,标志着OCP正式将矛头对准AI时代的网络瓶颈。
可以预见,未来几年,ESUN制定的标准很可能成为AI数据中心网络的“事实规范”。
对于普通用户来说,这或许只是技术新闻。但对于AI产业而言,ESUN的意义堪比当年TCP/IP协议的普及。它有望打破InfiniBand等封闭生态的垄断,降低AI基础设施门槛,加速大模型迭代。想象一下,如果每个AI创业公司都能用标准化、低成本的以太网搭建高性能训练集群,那创新的速度将呈指数级增长。而这,正是OCP“让尖端技术普惠化”使命的又一次生动实践。
目前,ESUN工作流将在OCP全球峰会后正式启动,并向所有感兴趣的企业、研究机构和开发者开放。无论你是网络设备商、芯片厂商,还是AI算法工程师,都可以参与其中,共同定义下一代AI网络。这不仅是一次技术协作,更是一场生态共建。毕竟,在AI这场马拉松中,没有人能独自跑到终点。只有开放合作,才能让整个行业跑得更快、更远。
最后划重点:ESUN不是炫技,不是概念,而是为了解决AI扩展型网络的真实痛点;它由十二家顶级科技公司联合发起,代表行业共识;它坚持开放标准,拒绝私有协议;它将与UEC、IEEE等组织协同,确保技术落地;它属于OCP Networking Project的一部分,继承OCP一贯的开源、协作、实用精神。如果你正在构建AI基础设施,或者关心AI算力的未来,那么ESUN绝对值得你持续关注。
现在除了NVLink、UALink、UEC和SUE以外有了ESUN!