OpenAI暴击全球编程冠军!GPT5率队满分碾压人类谷歌

OpenAI在2025国际大学生编程竞赛全解12题,击败人类冠军与谷歌Gemini。采用GPT-5+实验模型双系统协作,未针对比赛特殊训练,展现超强通用推理能力。

OpenAI的新模型在2025年ICPC世界总决赛中获得了12/12的满分,Google模型获得了10/12

OpenAI 居然在全球顶级的大学编程比赛里把人类学霸和谷歌大佬全都给干趴下了!这可是编程圈里的“奥林匹克”啊!

先说说这比赛多厉害哈。国际大学生程序设计竞赛(ICPC)2025年总决赛,绝对是全球最硬核的编程擂台,来自各国名校的学霸团队得在五小时内搞定12道变态难度的编程题。

OpenAI表示,该系统在与学生相同的条件下进行竞争。它收到了标准PDF格式的问题集,并有五个小时的时间限制提交解决方案。提交的作品被直接发送给ICPC的一位官方评委,由他与人类参赛作品同时进行评估。该公司强调,没有为比赛做特别调整。

结果你猜怎么着?OpenAI派出的AI系统,直接满分通关!一道题都没错!连裁判都是大赛官方的人,AI和人类队伍同一时间拿到题目、同一标准判卷,绝对公平对决!

更绝的是,就在前几天谷歌Deepmind才高调宣布,他家新一代Gemini 2.5系统在同一比赛拿了“金牌水平”——解决了10道题,还破了一道人类都没解出的难题。不过,它在另外两个问题上失败了。

本来觉得已经牛炸天了,结果OpenAI反手就是一个12题全对!直接碾压!这波操作,堪称科技圈“贴脸开大”啊!凭借完美的12分,OpenAI的参赛成绩超过了Deepmind的成绩。


关键来了!OpenAI这波怎么赢的?人家压根没专门为比赛训练模型!而是组了个“双王牌阵容”:一个是咱们熟悉的GPT-5,另一个是内部实验级的推理模型。GPT5负责疯狂输出答案,实验模型当“总监工”决定交哪份答案。11道题靠GPT5搞定,最后那道地狱级难题,GPT5卡壳了,实验模型亲自出马,试了9次才过关——要知道人类冠军团队也只解出11题呢!

OpenAI团队直接凡尔赛:这证明咱家模型不仅能力强,还特别持久!能长时间深度推理!

项目负责人莫斯塔法·罗哈尼内贾德更放话:该公司将胜利视为稳步发展的一部分。同样的模型已经在国际数学奥林匹克国际信息学奥林匹克竞赛中产生了金牌水平的结果。参与该项目的Mostafa Rohaninejad称ICPC的表现是这一趋势的恰当结论,指出了该系统的多功能性。他补充说,下一个前沿将是能够发现新知识的系统,他将其描述为真正的里程碑。

总结

  • OpenAI的系统在2025年ICPC世界总决赛中的表现优于所有人类团队和Google Deepmind,在标准比赛条件下解决了比赛的12个编程问题中的每一个。
  • 该系统使用GPT-5和内部实验模型的组合; GPT-5为11个问题提供了正确的解决方案,而实验模型解决了最困难的任务,需要九次尝试才能接受。
  • OpenAI将这一成就描述为主要学术竞赛中一系列备受瞩目的胜利的一部分,强调了高级推理模型解决复杂的现实世界问题集的能力不断增强,并暗示了人工智能可以产生新知识的雄心。