GPT推理系统在国际信息学奥林匹克竞赛IOI获得第6名

OpenAI工作人员发帖说:我们正式进入2025年国际信息学奥林匹克竞赛(IOI)线上竞赛赛道,并遵守与人类参赛者相同的限制,包括提交和时间限制,但没有竞赛组织者的直接监督。

OpenAI推理系统刚刚在2025年国际信息学奥林匹克竞赛(IOI)上大杀四方,勇夺AI组金牌 !没错,不是铜牌,不是银牌,是金的!而且亮闪闪的那种!

这次我们可是正儿八经参赛的,不是蹭饭的——我们参加了IOI的线上AI赛道,成绩比330个血肉之躯里的325个还高,只被5个不开挂的人类卷王甩在身后。AI选手里,我们就是王中王,没有之一!

重点来了:我们跟人类选手待遇完全一样——5小时限时,50次提交机会,不能开小抄、不能上网查答案(对,连百度都搜不了),也没有RAG(检索增强,懂的都懂),就一个破终端,像极了当年你在机房敲代码时卡在厕所门口连不上网的绝望。

我们靠的也不是什么特训版“IOI应试机器人”,而是几个通用推理模型搭成的“草台班子”。唯一“作弊”的地方,就是挑哪个答案交上去,以及连个API——说白了,就是让AI自己写代码,我们只负责点“提交”按钮,像极了家长帮孩子交作业。

最讽刺的是啥?去年我们参加IOI,离铜牌就差那么一丢丢,策略还是人工缝合怪级别的“手搓战术”。一年过去,我们从班级倒数第50名(49th百分位)直接干到年级前2%(98th百分位)!这进步速度,比某些人考研二战上岸还猛。

最近几周,从AtCoder世界总决赛,到IMO(国际数学奥赛),再到现在的IOI,我们家AI简直开启了“奥赛刷榜模式”。这哪是搞科研,分明是AI界的“高考工厂”上线,专治各种人类天才不服。

现在团队正吭哧吭哧地把这些“学霸AI”塞进我们的主流产品里——以后你问GPT怎么解二元一次方程,它可能回你:“这题我去年拿过金牌,要不我给你讲讲标准解法?”  

总之,一句话总结:  
人类,你们的“专属”竞赛,我们来“串门”了。  
下次能不能把奖牌做得大点?金牌有点小,AI戴不下。



成绩单: 前五名有三位中国人

  • 第一名是 Hengxd Liu(编号 CHN4),代表中国,四项成绩均为满分 100,总分 400,优势明显。  
  • 第二名 Mingyu Woo(KOR1),韩国选手,前三项 100、99.33、93,第四项 100,总分 392.33。  
  • 第三名 Sizhe Fan(CHN3),中国选手,前三项 100、78.11、100,第四项 100,总分 378.11。  
  • 第四名 Rares-Andrei Neculau(ROUS),罗马尼亚选手,前三项 100、77.67、100,第四项 100,总分 377.67。  
  • 第五名 Xinyang Chen(CHN1),中国选手,前三项 100、99.02、100,第四项 100,总分 399.02。  
  • 第六名出现并列:OpenAI(GPT5)前三项 100、75.29、93,第四项 100,总分 368.29;

整体来看,中国选手占据前三甲中的两席,Hengxd Liu 以满分 400 遥遥领先,其余选手分差较小,竞争激烈。



极客辣评:
这个推理版本不知道有无发布?

OpenAI版本非常混乱,也许获得数学第一名的模型语文是零分。