谷歌双子座大模型:号称超越 GPT-4 和人类专家


Google推出新人工智能双子座Gemini 是有史以来第一个在 MMLU 上达到 90.0% 的大模型,表现优于人类专家;在基准测试中击败 GPT-4。

Gemini 被设计为多模式的,可以跨不同类型的输入(如文本、图像、视频、音频和代码)进行推理。它在语言、推理、数学、代码生成和多模式任务的各种基准方面优于以前的模型和人类专家。

分三个版本:

  • Ultra 适用于高度复杂的任务,
  • Pro 适用于各种任务
  • Nano 适用于高效的设备上任务。

首先他们介绍即将推出的Gemini Ultra:
Gemini Ultra在新的MMMU基准测试中取得了 59.4% 的最先进分数,该基准测试由跨越不同领域、需要深思熟虑的推理的多模态任务组成。

根据我们测试的图像基准,Gemini Ultra 的性能优于以前最先进的模型,无需从图像中提取文本以进行进一步处理的对象字符识别( OCR ) 系统的帮助。这些基准凸显了Gemini天生的多模态性,并表明了Gemini更复杂推理能力的早期迹象。

Gemini 1.0 经过训练,可以同时识别和理解文本、图像、音频等,因此它可以更好地理解微妙的信息,并可以回答与复杂主题相关的问题。这使得它特别擅长解释数学和物理等复杂学科的推理。

我们的第一个版本的 Gemini 可以理解、解释和生成世界上最流行的编程语言(如Python、Java、C++和 Go)的高质量代码。它跨语言工作和推理复杂信息的能力使其成为世界领先的编码基础模型之一。

使用 Gemini 的专门版本,我们创建了更先进的代码生成系统AlphaCode[url=https://goo.gle/AlphaCode2] 2[/url],它擅长解决超出编码范围、涉及复杂数学和理论计算机科学的竞争性编程问题。

当在与原始AlphaCode相同的平台上进行评估时,AlphaCode 2 显示出巨大的改进,解决的问题数量几乎是原来的两倍,我们估计它的表现优于 85% 的竞赛参与者,而AlphaCode的这一比例接近 50% 。

在TPU上,Gemini 的运行速度明显快于早期、较小和功能较差的型号。这些定制设计的人工智能加速器一直是谷歌 人工智能产品的核心,这些产品为搜索、 YouTube、Gmail、谷歌地图、Google Play和 Android等数十亿用户提供服务。它们还使世界各地的公司能够经济高效地训练大规模人工智能模型。安卓。它们还使世界各地的公司能够经济高效地训练大规模人工智能模型。

今天,我们宣布推出迄今为止最强大、最高效且可扩展的 TPU 系统Cloud TPU v5p,专为训练尖端 AI 模型而设计。这款下一代TPU将加速Gemini的开发,帮助开发者和企业客户更快地训练大规模生成式AI模型,让新产品和能力更快地到达客户手中。

移动端
Pixel 8 Pro 是第一款运行 Gemini Nano 的智能手机,它支持 Recorder 应用中的 Summarize 等新功能,并从 WhatsApp 开始推出 Gboard 中的 Smart Reply,明年还会推出更多消息应用。

Google AI Studio 是一款基于网络的免费开发者工具,可使用 API 密钥快速构建应用程序原型并启动应用程序。

Android 开发人员还可以通过 AICore(Android 14 中提供的新系统功能,从 Pixel 8 Pro 设备开始)使用 Gemini Nano(我们最高效的设备端任务模型)进行构建。Android开发人员还可以通过 AICore(Android 14 中提供的新系统功能,从 Pixel 8 Pro 设备开始)使用 Gemini Nano(我们最高效的设备端任务模型)进行构建。AICore是 Android 14 中提供的一项新系统功能,从 Pixel 8 Pro 设备开始。Android 14,从 Pixel 8 Pro 设备开始。

网友讨论:

  • GPT-4 在 5-shot 和 32-shot MMLU 上仍然优于 Gemini,只是当 google 引入“Uncertainty-routed”(我认为就像思想树)时,它才比 GPT-4 好不到 3%。
  • 奇点需要一个可以做数学和计算机科学的人工智能编码员:使用 Gemini 的专门版本,我们创建了更先进的代码生成系统AlphaCode 2
  • 在代码生成任务上,它只比 GPT4 好一点点
  • 在 codeforces 竞争性编程方面,其性能比 GPT4 好约 16 倍。GPT4 获得第 5%,AlphaCode2 获得 85%
  • OpenAI 在 ChatGPT 上的成功迫使 Google 推出了自己的竞争对手。谷歌坐拥所有这些研究成果,不敢用它做任何公开的事情。
  • Gemini ultra要到明年才会上市,这是真正重要并超越gpt4的型号
  • 有史以来第一个在 MMLU 上达到 90.0% 的大模型,表现优于人类专家;在基准测试中击败 GPT-4
  • 谷歌已经浪费了其在人工智能研究领域的早期领先地位,目前的产品也令人印象深刻。
  • Gemini Ultra 尚未发布,距离发布还有几个月的时间;Gemini Pro 在欧洲不可用,并且不是多模式的,链接;Gemini Pro 没有真正公开统计数据,专业统计数据不在网站上,而是藏在论文中。这是夸大的炒作。今天发布的 GPT-4 没有竞争对手。如果能向大​​多数国家/地区发布一些可用的内容并附上广告统计数据,那就更好了。