科技公司合作制定 6 位和 4 位人工智能数据格式的开放标准

banq


AMD、Arm、英特尔、Meta、微软、NVIDIA 和高通标准化人工智能的下一代窄精度数据格式。

微缩格式(MX)联盟由 AMD、Arm、英特尔、Meta、微软、英伟达(NVIDIA)和高通技术公司(Qualcomm Technologies, Inc.该规范被称为 "microscaling",以 FP8 和 INT8 等 8 位格式为基础,以降低更广泛采用这些格式的障碍。

最初的 MX 规范引入了四种具体的浮点和整数格式,它们与现有的人工智能堆栈兼容,支持灵活的实施,并能在硬件中实现细粒度的微缩。

研究表明,MX 可以轻松部署到各种应用中,如大型语言模型、计算机视觉和推荐系统,还能在不修改的情况下以 6 位和 4 位精度训练大型语言模型。

MX 在开放计算项目基金会的开放许可下发布,旨在促进开放性、问责制和负责任的人工智能开发,同时通过标准化和互操作性加速创新。

点击标题链接获取规范、白皮书和代码。评论讨论了标准化的潜在益处以及 Nvidia 参与该联盟的情况。

好处:

  • 当前硬件处理极低精度的方式效率相当低。通常,人们需要使用一些技巧来进行较低精度的预训练,例如,对于 FP16需要损失缩放;而使用 MX,您无需任何技巧即可以 6 位精度进行训练,并达到与 FP32 相同的损失。
  • 虽然 Nvidia 在训练方面近乎垄断,但推理方面则更加跨平台。
  • 标准化至关重要。如果没有它,事情可能会变得过于复杂,并且很难开发技术来支持公约之外的数据消费。
  • 一旦内存和计算成本进一步下降,人们可能不会再追求更高的精度