OpenAI发布新智能体：deep research

#用户体验UX #DeepSeek时刻 #AI智能体Agent #ChatGPT等OpenAI技术

2025-02-03 banq

OpenAI又发布了一个名称类似deepseek的“深度研究”模型，它的表现比之前的模型强得多，甚至能完成一些连博士专家都需要花10小时才能搞定的任务。

周五，在“人类的最后考试”测试中最高分达到了 13% 的 o3-mini-high已经发布。

周日，深度研究在这项测试中居然达到 26.6%。

这个深度研究模型不仅是个超级智能助手或智能体，还可以看作是互联网的新界面。

我们现在用互联网的方式其实挺麻烦的——搜索、点击、筛选信息，既费时又费力，而且我们不可能知道所有网站的存在。

但人工智能不一样，它不会累，可以同时浏览很多网站，还拥有几乎无限的知识。

有了这个深度研究模型，我们进入了一个新时代：以前人类要花几个小时才能找到的信息，现在人工智能几分钟就能帮你搞定。

比如：
- 你不用再翻几百条评论去挑酒店、餐厅或产品，AI 会帮你总结好所有相关信息。

- 旅行时，AI 能从各种网站、甚至小众论坛里给你找到最好的建议。

- 如果你有个新科学想法，AI 能快速帮你找到相关文献、研究方向和专家名单。

这就像是一个为你量身定制的互联网，完全根据你的需求来提供信息。

未来，手动浏览互联网可能会变得像用计算器代替手算一样，成为“老派”做法。

奥特曼发推：
今天我们开始深入研究我们的下一个代理。这就像是一种超能力；按需提供专家！

它可以使用互联网，进行复杂的研究和推理，并返回报告。它确实很棒，可以完成以前需要花费数小时/数天和数百美元的任务。

注意按需提供专家，实际上类似把大模型拆成小模型一个个卖，解决了大规模单点风险问题，也解决了对硬件等基础设施无止境的贪求。相当于把一个大数据库拆成小数据库，把Oracle拆成小sqllite。

奥特曼继续推广：人们会发布很多很好的例子，但这里有一个有趣的例子：我现在在日本，正在寻找一辆旧款 NSX。我花了几个小时寻找完美的一辆，但没有成功。我正要放弃，经过深入研究...终于找到了。

这个模型需要密集计算，速度慢，但它是第一个能够完成如此多种复杂、有价值任务的人工智能系统。

面临deepseek深度追索：
Deepseek 现已占据 ChatGPT 每日活跃用户的 23%。每日应用下载量也大幅增加。