2025第一季AI爆发：17个模型4个冠军

2025-03-27 banq

我们已经进入 2025 年 3 个月了……随着 Deepseek V3 新品和 Gemini 2.0 pro 实验版 03-25 的发布，今年迄今为止至少已发布了 17 个主要模型，其中 4 个模型在各种指标/基准/分析中独立占据了 SOTA 位置。

在这些模型中......

Gpt 4.5在情商和创意写作基准测试中总体评分最高
Claude 3.7Sonnet 在现实世界的 SWE 基准测试中获得了最高评分，但现在与 Gemini 2.0 pro 实验版 03-25 展开激烈竞争
Grok 3 思维在发布时的一些基准测试中一度达到 SOTA 水平，但目前已被最新的 OpenAI、Deepseek、Anthropic 和 Gemini 模型所超越
除此之外，许多 7B、24B、27B、32B、9B 和 4B 模型的表现都优于去年 B 参数高达 100 的模型

一系列人工智能模型及其发布日期。以下是具体内容：

我们每天都会收到新的 SOTA（顶级模型），但是昨天太疯狂了，我们一下子收到了 3 个 SOTA：