OpenAI发布新智能体:deep research


OpenAI又发布了一个名称类似deepseek的“深度研究”模型,它的表现比之前的模型强得多,甚至能完成一些连博士专家都需要花10小时才能搞定的任务。

周五,在“人类的最后考试”测试中最高分达到了 13% 的 o3-mini-high已经发布。

周日,深度研究在这项测试中居然达到 26.6%。

这个深度研究模型不仅是个超级智能助手或智能体,还可以看作是互联网的新界面

我们现在用互联网的方式其实挺麻烦的——搜索、点击、筛选信息,既费时又费力,而且我们不可能知道所有网站的存在。

但人工智能不一样,它不会累,可以同时浏览很多网站,还拥有几乎无限的知识。

有了这个深度研究模型,我们进入了一个新时代:以前人类要花几个小时才能找到的信息,现在人工智能几分钟就能帮你搞定。

比如:
- 你不用再翻几百条评论去挑酒店、餐厅或产品,AI 会帮你总结好所有相关信息。

- 旅行时,AI 能从各种网站、甚至小众论坛里给你找到最好的建议。

- 如果你有个新科学想法,AI 能快速帮你找到相关文献、研究方向和专家名单。

这就像是一个为你量身定制的互联网,完全根据你的需求来提供信息。

未来,手动浏览互联网可能会变得像用计算器代替手算一样,成为“老派”做法。


奥特曼发推:
今天我们开始深入研究我们的下一个代理。这就像是一种超能力;按需提供专家!

它可以使用互联网,进行复杂的研究和推理,并返回报告。它确实很棒,可以完成以前需要花费数小时/数天和数百美元的任务。

注意按需提供专家,实际上类似把大模型拆成小模型一个个卖,解决了大规模单点风险问题,也解决了对硬件等基础设施无止境的贪求。相当于把一个大数据库拆成小数据库,把Oracle拆成小sqllite。

奥特曼继续推广:人们会发布很多很好的例子,但这里有一个有趣的例子:我现在在日本,正在寻找一辆旧款 NSX。我花了几个小时寻找完美的一辆,但没有成功。我正要放弃,经过深入研究...终于找到了。

这个模型需要密集计算,速度慢,但它是第一个能够完成如此多种复杂、有价值任务的人工智能系统。

面临deepseek深度追索:
Deepseek 现已占据 ChatGPT 每日活跃用户的 23%。每日应用下载量也大幅增加。