DeepSeek加持!Perplexity深度研究直追o3

banq


Perplexity Deep Research 在 Humanity Last Exam Benchmark 上与 OpenAI o3 相当接近,第二名。但是速度快了一个数量级且成本更低。这是因为 DeepSeek 是开源的,而且成本低廉且速度快。


 1. 性能对比

  •  Perplexity Deep Research在 Humanity’s Last Exam 测试中,准确率达到了 20.5%,比 Gemini Thinking、o3-mini、o1 和 DeepSeek-R1 等模型表现更好。
  • OpenAI o3 的准确率更高,为 26.6%,仍然是目前最强的模型。

虽然 OpenAI o3 的准确率更高,但 Perplexity Deep Research 的表现也很出色,尤其是在速度和成本上更有优势。

2. 性价比

  • Perplexity Deep Research 完成研究任务通常只需要 不到 3 分钟,而 OpenAI 的 Deep Research 功能需要 5 到 30 分钟,时间长短取决于任务的难度。
  • Perplexity 之所以这么快,是因为它用了开源的 DeepSeek模型,这个模型不仅速度快,而且成本低。

这一基准测试涵盖了 100 多个学科、3000 多个专家级问题,涉及数学、科学、历史、文学等领域,旨在评估 AI 模型在复杂推理和多领域知识上的能力。


总结
Perplexity Deep Research 在 Humanity’s Last Exam Benchmark 上的表现接近 OpenAI o3,尽管在准确率上稍逊一筹,但其速度更快、成本更低,且对用户更加友好。这种平衡使得 Perplexity 在 AI 研究工具市场中占据了独特的竞争优势。