有网友对OpenAI最近推出的o4-mini和o3可能从最新的gpt-5模型精简出来的版本:
第一点: OpenAI每次推出O系列产品时,都会先放出一个全新的迷你版给大家用,然后再展示更大的模型。他们不能直接发布大模型(在演示的时候),因为对普通用户来说实在太烧钱了。得先把模型反复打磨优化才能正式发布(之前的O3和O3-mini就是这样)。
现在的问题是:我们根本没看到O4的演示。这说明O4压根就不存在,而我们以为的O4其实还在训练中(很可能就是GPT-5)。这也意味着现在新发布的O3,和OpenAI几个月前内部用的O3完全不是一回事(因为Arc-AGI成本太高了,回答一个问题要花1000美元)。现在这个新模型是经过超级优化的。
第二点: 一般来说,小模型的行为和大模型很像,你能感觉到它们的说话语气和风格、氛围感是一脉相承的。我觉得o3和o4-mini就是很像的模型,在我写代码和搞创意写作的时候,发现它们有很多共同特点。o4-mini比o3-mini说话更简洁,o3也是这样的。所以我有理由相信,它们都是从同一个大模型里精简出来的两个版本(一个精简得多,一个精简得少一点)。
最后结论: 我觉得根本不存在o4。现在的o4-mini和o3,其实都是从最新的gpt-5模型精简出来的版本。
网友: 估计他们有一个团队专注于他们最强大的推理模型,还有一个团队专注于他们最经济高效的推理模型。随着规模扩大并取得更好的结果,他们简单地将前者打包为 oN,将后者打包为 o(N+1)-mini。
随机假设:OpenAI 有两个团队,一个负责构建 o1 o2 o3 类模型,另一个负责构建 GPT3 4 4.5 类模型,而o-团队做得更好