OpenAI在Elo评分中以1355分遥遥领先


Elo评分系统是由匈牙利裔美国物理学家阿帕德·埃洛(Arpad Elo)创建的,最初用于评估国际象棋选手的实力。这个系统基于统计学原理,通过比赛结果来调整参与者的评分,从而反映他们的实力。

上图是截至2024年12月18日评分,OpenAI再次凭借o1模型领先。