苹果开发出在iPhone上运行大模型的突破性方法

苹果 GPT大语言模型就在你的口袋里，这可能比你想象的更早成为现实。

苹果人工智能研究人员表示，通过发明创新的闪存利用技术，他们在iPhone和其他内存有限的苹果设备上部署大型语言模型( LLM )方面取得了关键突破。

ChatGPT和 Claude等基于 LLM 的聊天机器人非常需要大量数据和内存，通常需要大量内存才能运行，这对于iPhone等内存容量有限的设备来说是一个挑战。为了解决这个问题，苹果研究人员开发了一种新技术，使用闪存（应用程序和照片所在的内存）来存储人工智能模型的数据。

在一篇题为“闪存中的LLM ：有限内存下的高效大型语言模型推理”的新研究论文中，作者指出，移动设备中的闪存存储比传统上用于运行LLM 的RAM更丰富。他们的方法巧妙地绕过了限制，使用了两种关键技术，最大限度地减少数据传输并最大限度地提高闪存吞吐量：

据该论文称，这些方法的结合使人工智能模型的运行速度可达iPhone可用内存的两倍。这意味着标准处理器 (CPU) 的速度提高了 4-5 倍，图形处理器( GPU ) 的速度提高了 20-25 倍，令人印象深刻。

据报道，苹果正在开发自己的生成式人工智能模型，称为“ Ajax ”。

Ajax旨在与OpenAI 的 GPT-3和GPT-4 等产品相媲美，它可运行 2000 亿个参数，这表明语言理解和生成具有高水平的复杂性和能力。Ajax在内部被称为“ Apple GPT ”，旨在统一整个Apple 的机器学习开发，提出了将人工智能更深入地集成到Apple生态系统中的更广泛战略。

截至最新报告，Ajax被认为比上一代ChatGPT 3.5 更强大。然而，也有人认为，截至 2023 年 9 月，OpenAI 的新模型可能已经超出了Ajax的能力。

苹果将在 2024 年末左右在 iPhone和iPad上提供某种生成式 AI 功能，届时iOS 18 将会发布。苹果将在 2023 年建造数百台 AI 服务器，并在 2024 年建造更多服务器。据报道，苹果将提供基于云的人工智能和人工智能与设备上处理的结合。