DeepSeek加持！Perplexity深度研究直追o3

#DeepSeek时刻 #ChatGPT等OpenAI技术

2025-02-16 banq

Perplexity Deep Research 在 Humanity Last Exam Benchmark 上与 OpenAI o3 相当接近，第二名。但是速度快了一个数量级且成本更低。这是因为 DeepSeek 是开源的，而且成本低廉且速度快。

1. 性能对比

Perplexity Deep Research在 Humanity’s Last Exam 测试中，准确率达到了 20.5%，比 Gemini Thinking、o3-mini、o1 和 DeepSeek-R1 等模型表现更好。
OpenAI o3 的准确率更高，为 26.6%，仍然是目前最强的模型。

虽然 OpenAI o3 的准确率更高，但 Perplexity Deep Research 的表现也很出色，尤其是在速度和成本上更有优势。

2. 性价比

Perplexity Deep Research 完成研究任务通常只需要不到 3 分钟，而 OpenAI 的 Deep Research 功能需要 5 到 30 分钟，时间长短取决于任务的难度。
Perplexity 之所以这么快，是因为它用了开源的 DeepSeek模型，这个模型不仅速度快，而且成本低。

这一基准测试涵盖了 100 多个学科、3000 多个专家级问题，涉及数学、科学、历史、文学等领域，旨在评估 AI 模型在复杂推理和多领域知识上的能力。

总结
Perplexity Deep Research 在 Humanity’s Last Exam Benchmark 上的表现接近 OpenAI o3，尽管在准确率上稍逊一筹，但其速度更快、成本更低，且对用户更加友好。这种平衡使得 Perplexity 在 AI 研究工具市场中占据了独特的竞争优势。

DeepSeek加持！Perplexity深度研究直追o3

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道