近期大模型AIGC概要:Grok 1.5 视觉升级等

埃隆·马斯克 (Elon Musk) 的使命是证明开源人工智能可以与最好的人工智能竞争,而 Grok 的最新升级刚刚向前迈出了一大步。

凭借超越顶级模型的新多模态能力,xAI 正在悄悄地展现出自己是人工智能重量级世界中的有力竞争者。让我们探索一下……

近期人工智能概要中:

  • Grok 1.5 获得视觉升级
  • Adobe Firefly 使用 Midjourney 图像进行训练
  • 使用 ChatGPT 在几秒钟内创建思维导图
  • 谷歌 DeepMind 机器人踢足球
  • 6 个新的人工智能工具

Grok 1.5 获得视觉升级
概要:
 Elon Musk 的 xAI 刚刚推出了Grok-1.5 Vision,这是对开源模型的多模式升级,允许处理视觉信息。
细节:

  • Grok 1.5V 现在可以处理文档、图表、屏幕截图和照片等视觉信息,重点是对现实世界的理解。
  • xAI 创建了一个新的“RealWorldQA”基准来评估空间理解,其中 Grok-1.5V 的性能优于 GPT-4V 和 Gemini。
  • xAI 表示 1.5-V 将很快向测试人员和现有用户推出,预计未来几个月将在图像、音频和视频方面实现重大改进。

为什么重要:虽然 Grok 在更广泛的 LLM 讨论中感到没有得到充分重视,但令人印象深刻的愿景升级表明开源模式正在参与竞争。凭借埃隆在 X 和特斯拉的数据库以及他肩上的芯片,现在可能是业界开始关注的时候了。

Adobe Firefly 使用 Midjourney 图像进行训练
概要:
在一份令人惊讶的新报告中,Adobe 的 Firefly AI 图像生成器据称在其训练数据中使用了 Midjourney 等竞争对手创建的数千张图像。 
细节:

  • 该报告显示,用于训练 Firefly 的图像中约有 5% 是人工智能生成的,其中包括一些由竞争对手 Midjourney 创建的图像。
  • Adobe 将 Firefly 宣传为“商业安全”选项,声称它主要是根据自己的 Adob​​e Stock 库中的许可图像进行训练的。
  • Adobe 为这种做法进行了辩护,称所有图像(包括人工智能生成的图像)​​都经过了审核过程。
  • 据报道,Adobe 内部存在分歧,员工质疑使用人工智能图像进行培训的道德规范。

重要性:虽然 Adob​​e 将 Firefly 定位为竞争对手的道德、合法的替代品,但在训练数据中使用 Midjourney 的图像会严重破坏这一主要卖点。它还可能削弱艺术家和企业客户之间的信任——他们可能被现在看来是虚假的承诺所吸引。

使用 ChatGPT 在几秒钟内创建思维导图 
概要:在本教程中,您将学习如何使用 ChatGPT 免费将复杂的想法转化为可视化且信息丰富的思维导图。
一步步:

  1. 前往ChatGPT。您可以使用 GPT-3.5(免费版本)或 GPT-4(付费版本)。
  2. 写下以下提示:“创建[您的主题]的思维导图。将主题列为中心思想、主要分支和子分支。”
  3. ChatGPT 生成初始思维导图轮廓后,请求 Markdown 格式:“以 Markdown 格式创建相同的思维导图。”
  4. 将 Markdown 粘贴到Markmap中,然后您的思维导图就会变得栩栩如生。

额外提示: 您可以自定义思维导图的外观,然后将其下载为交互式 HTML 或静态 SVG。

Google DeepMind 机器人踢足球
概要:谷歌 DeepMind 和剑桥大学的研究人员刚刚教授微型人形机器人相互踢足球,展示了复杂的技能学习和敏捷的适应能力。
细节:

  • 研究人员首先教授步行和起立等基本技能,然后让机器人练习与逐渐改进的自己版本进行比赛。
  • 与基准机器人相比,经过 AI 训练的机器人行走速度几乎提高了 3 倍,转身速度加快了 5 倍,跌倒后站起来的速度加快了 63%。
  • 研究人员发现,人工智能有助于学习聪明的策略,例如在没有明确告知的情况下进行防守时采取短而快的步骤。

重要性:虽然这些笨拙但可爱的机器人不会很快参加世界杯,但这项研究证明了人工智能在实现复杂技能学习和适应能力方面的力量,甚至导致它们自己发展出独特的行为和战术。

流行的人工智能工具

  •  LangAI  - 用 20 多种语言与 AI 流畅聊天 
  •  eezyCollab  - 通过经济实惠的影响者合作提升您的品牌 
  •  Sana AI  - 团队人工智能知识助手 
  •  Wonders  - 涵盖 5.2 亿多篇研究论文的 AI 搜索引擎
  •  Akuma  - 使用实时 AI 画布创作动漫艺术 
  •  DomoAI  - 将图像转换为动态视频 

快速简要:

  • OpenAI最新更新的 GPT-4 Turbo 模型重新夺回了LMSYS 法学硕士排行榜的榜首,投票数超过了 Claude 3 Opus。
  • 谷歌宣布将于 6 月推出一款名为 Vids 的新人工智能应用程序,它将充当创建视频内容的写作、制作和编辑助手。
  • Avenged Sevenfold 主唱 M Shadows表示,未来粉丝们不会关心音乐是由人工智能还是人类创作的,他称人工智能是一个“更深层次的工具”,可以帮助激发音乐家的创造力,而不是对艺术家的威胁。
  • 埃隆·马斯克(Elon Musk)(也许是在开玩笑)在突破奖颁奖典礼上接受采访时提出了人工智能模型在 2032 年竞选总统的可能性。
  • Autodesk 的一项新调查发现,“使用人工智能工作的能力”被认为是未来各个就业领域最重要的技能。
  • 2024 年大师赛实施了多项 AI 功能,以增强高尔夫赛事的报道,包括球场洞察、AI 支持的旁白、3D 球场渲染和个性化精彩片段。