OpenAI和谷歌分别发布重大更新

今天OpenAI和谷歌分别发布重大更新:

1、OpenAI推出第一个文本转视频模型
Sora 是一个 AI 模型,可以根据文本指令创建现实且富有想象力的场景。

Sora 能够生成一分钟的高保真视频。我们的结果表明,扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。

12分钟所有 Sora OpenAI 生成的示例视频的汇编(12 分钟)

网友讨论:

  • 因为感觉这是人工智能历史上的一个重要时刻,很荣幸看到它发生在我们眼前。

2、谷歌推出下一代型号:Gemini 1.5
模型显着增强了性能,在跨模式的长上下文理解方面取得了突破。

Gemini 1.5 Pro 配备了标准的 128,000 令牌上下文窗口。更长的上下文窗口向我们展示了可能性的希望。它们将实现全新的功能,并帮助开发人员构建更有用的模型和应用程序。

Gemini 1.5 Pro 还融入了一系列重大架构更改,可在不降低性能的情况下对输入进行长上下文理解,最多可处理 1000 万个令牌

  • 当我们推出完整的 100 万个令牌上下文窗口时,我们正在积极进行优化,以改善延迟、减少计算要求并增强用户体验。
  • 在多个维度上都显示出显着的改进,并且 1.5 Pro 实现了与 1.0 Ultra 相当的质量,同时使用更少的计算。

这意味着 1.5 Pro 可以一次性处理大量信息 - 包括 1 小时的视频、11 小时的音频、超过 30,000 行代码或超过 700,000 个单词的代码库。在我们的研究中,我们还成功测试了多达1000 万令牌。

网友讨论:

  • 他们在文章中声称它有高达 1M 的 token 上下文窗口(chatGPT 4.0 pro是128K),如果它在阅读极长的文本时实际上有 99% 的准确率,那仍然是疯狂的。
  • 真的希望这会给 OpenAI 带来压力,因为如果这就是他们所做的一切,并且他们及时公开发布它,那么谷歌将是最快发布强大的人工智能模型的人
  • 昨天盘后,The Information 报道称 OpenAI 正在开发一款搜索引擎产品,股价开始下跌
  • 从20万令牌直接涨到1000万!!!最重要的是,准确性根本没有下降,它只是爆炸了!
  • 一旦每个人都开始复制谷歌在这里所做的事情,RAG 就会在几个月内消亡。这太疯狂了!!!
  • 到目前为止,谷歌有一个可怕的记录,即过度宣传特定功能,然后让实际的人工智能在发布时或多或少毫无用处。