Ferret:苹果多模式大型语言模型

banq

苹果推出了Ferret,一个多模式的LLM,作为开源,标志着其进军AI领域,并暗示iPhone AI集成。

苹果和哥伦比亚大学的研究人员于 2023 年 10 月低调地发布了一个名为 Ferret 的开源多模式法学硕士。该版本包含代码和权重,但仅供研究使用,而非商业许可。

当时没有受到太多关注。但现在这种情况可能正在改变:随着Mistral的开源模型成为最近的头条新闻,谷歌的 Gemini 模型即将登陆Pixel Pro 并最终登陆 Android,关于本地大模型为小型设备提供支持的潜力的讨论越来越多。

最近,这种讨论有所增加,因为苹果公司宣布在 iPhone 上部署大模型方面取得了重大突破:该公司发布了两篇新的研究论文,介绍了 3D 头像和高效语言模型推理的新技术。

这些进步被誉为可能带来更身临其境的视觉体验,并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。

AI 社区中的许多人后来才注意到 Ferret 的发布,他们庆祝苹果公司出人意料地进入开源 LLM 领域,特别是因为苹果公司历来被称为“围墙花园”。