代号为Gobi的GPT-5即将发布


据报道,OpenAI 正在加紧努力发布一种名为 GPT-Vision 的先进多模式法学硕士,代号为Gobi。

随着秋天的临近,谷歌OpenAI陷入了一场传统的软件竞赛,旨在推出下一代大型语言模型:多模式。这些模型可以处理图像和文本,例如,只需查看用户希望网站的外观的草图即可为网站生成代码,或者输出可视化图表的文本分析,这样您就不必问问你的工程师朋友这些是什么意思。

多模态人工智能的前景

  • 处理文本和图像:多模态 LLM 可以理解和生成文本与图像相结合的内容,从而提供更多的功能。
  • GPT-Vision受困于安全审查:但 "OpenAI的工程师似乎已接近满足法律方面的要求"。
  • 超越对手的关键优势:率先推出多模态能力可能会让 OpenAI 在与竞争对手的竞争中占据关键优势。

OpenAI急于发布Gobi的报道:
  • 旨在击败谷歌:OpenAI似乎有意在谷歌推出Gemini之前发布Gobi,从而在多模态领域占据主导地位。
  • 扩展 GPT-4 的功能:Gobi可能会在GPT-4的基础上增加增强的视觉和多模态功能,OpenAI早前曾预览过这些功能。
  • 进步的持久性:两家公司都认识到人工智能进步的长期性和竞争性。

简而言之:OpenAI 希望在人工智能竞赛中领先于谷歌,赶在谷歌的 Gemini 之前推出先进的多模态 LLM,这一先发制人的举措可能会打乱谷歌的计划和雄心。