OpenAI和谷歌分别发布重大更新

今天OpenAI和谷歌分别发布重大更新：

1、OpenAI推出第一个文本转视频模型
Sora 是一个 AI 模型，可以根据文本指令创建现实且富有想象力的场景。

Sora 能够生成一分钟的高保真视频。我们的结果表明，扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。

12分钟所有 Sora OpenAI 生成的示例视频的汇编（12 分钟）

网友讨论：

2、谷歌推出下一代型号：Gemini 1.5
模型显着增强了性能，在跨模式的长上下文理解方面取得了突破。

Gemini 1.5 Pro 配备了标准的 128,000 令牌上下文窗口。更长的上下文窗口向我们展示了可能性的希望。它们将实现全新的功能，并帮助开发人员构建更有用的模型和应用程序。

Gemini 1.5 Pro 还融入了一系列重大架构更改，可在不降低性能的情况下对输入进行长上下文理解，最多可处理 1000 万个令牌

这意味着 1.5 Pro 可以一次性处理大量信息 - 包括 1 小时的视频、11 小时的音频、超过 30,000 行代码或超过 700,000 个单词的代码库。在我们的研究中，我们还成功测试了多达1000 万令牌。

网友讨论：

他们在文章中声称它有高达 1M 的 token 上下文窗口（chatGPT 4.0 pro是128K），如果它在阅读极长的文本时实际上有 99% 的准确率，那仍然是疯狂的。
真的希望这会给 OpenAI 带来压力，因为如果这就是他们所做的一切，并且他们及时公开发布它，那么谷歌将是最快发布强大的人工智能模型的人
昨天盘后，The Information 报道称 OpenAI 正在开发一款搜索引擎产品，股价开始下跌
从20万令牌直接涨到1000万！！！最重要的是，准确性根本没有下降，它只是爆炸了！
一旦每个人都开始复制谷歌在这里所做的事情，RAG 就会在几个月内消亡。这太疯狂了！！！
到目前为止，谷歌有一个可怕的记录，即过度宣传特定功能，然后让实际的人工智能在发布时或多或少毫无用处。