AMD推出中国合规版MI308,迅速获得阿里巴巴巨额意向订单!
AMD MI308 Rollout规格
MI308是一款AI加速器,专为遵守美国出口管制规则而设计,与全性能同类产品相比,其浮点性能和互连带宽有所降低。
从公开信息看,MI308相较AMD完整性能的同代AI加速器,在浮点计算能力和高速互连带宽上都有明显下调,尤其是在多卡互联和大规模并行训练能力上,被刻意限制到无法高效支撑万亿参数级别模型训练的程度。
推理、视频理解、搜索排序、推荐系统、广告投放、工业视觉、内容生成后处理,这些应用每天都在吞噬海量算力,而它们对互连规模和极端浮点性能的需求,远低于训练阶段,这正好给了MI308一个巨大的生存空间,也解释了为什么它即便性能被削,依然有订单价值。
阿里巴巴集团正在考虑订购40,000至50,000台MI308加速器。
预计中国买家将使用这些芯片来执行推理、渲染和视频处理等强度较低的任务,而不是训练大型的前沿AI模型。因为在英伟达H20同样受制于许可不确定性、本土替代尚未完全成熟的当下,MI308提供的是一个确定性极高的选项:合法、可持续、规模化交付、生态成熟,而且性能刚好覆盖当前主流业务需求。
如果你站在阿里巴巴的视角,这个选择几乎是理性的不能再理性了
而且当前算力逻辑已经从单芯片强弱转移到算力中心的集群SuperPOD上,也就是说,直接与AI大模型有关的不是单个芯片多么厉害,而是系统性的效率,过去人们不懂芯片,不懂伸缩扩展,不懂集群,但是经过美股英伟达一波上涨后,人们已经逐步明白过来。
而且现在谁还从头开始预训练一个全新AI大模型啊?蒸馏不弱啊,谷歌的Gemini 3 Flash是从Gemini 3 Pro蒸馏出来的,结果很多测试指标超过Gemini 3 Pro!已确认 Gemini 3 Flash 使用了蒸馏预训练技术
15%收入要交给美国政府
美国政府已授予AMD向中国出口MI308的许可证,该协议要求AMD将这些销售收入的15%汇回美国政府。这是代收专利知识产权费的节奏吗?
---
补充:关于中国数据中心建设的一个有趣轶事。中国GPU带宽效率低下,导致人们将注意力集中在光互连技术上。光通信能实现万点集群。用光互联优势弥补gpu带宽不足。
“GPU带宽效率低下”这主要取决于SerDes芯片的工艺节点。由于无法使用 3nm/5nm 工艺节点,因此他们的带宽不如 TPU 或 Nvidia GPU。