第一位超越国际数学奥林匹克金牌得主的人工智能

本文重新审视了奥林匹克级几何中自动化定理证明的挑战，特别关注 IMO-AG-30 基准。作者认为，Wu 的方法是一种代数方法，以前被认为不如 AlphaGeometry 等合成方法有效，但它表现出了令人惊讶的强度，并且与其他技术结合时可以显着提高性能。

Wu 的方法可以将符号人工智能提升到银牌得主的竞争对手，而 AlphaGeometry 则可以超越 IMO Geometry 金牌得主。

主要发现：

论文的优点：

论文的缺点：

总的来说，本文为重新评估吴的方法及其在自动几何定理证明中的潜力提供了令人信服的案例。研究结果鼓励进一步探索这种方法并开发新的基准，以真正突破基于人工智能的几何推理的界限。

网友评论：
1. 十多年前，我就通过了数学奥林匹克竞赛，并获得了物理竞赛的资格。这是一种专门为提高几何解题能力而设计的狭义人工智能。当一个通用人工智能，甚至一个大模型能在数论或组合学（忘了拓扑学之类的东西）的问题上胜出/推理时，我就会觉得这很重要了，我很期待那一天的到来。也许就在今年年底？

2. 大大模型将狭义人工智能纳入其 MOE专家系统的一部分。

3. 诀窍不是获得具体问题的答案，而是将解决数学问题的推理能力融入一般思维中。 MOE专家系统无法解决这个问题，至少在所有数学位可以提供数字作为响应的情况下无法解决。

4. 当通用人工智能算法能够破解乘法时，我会很高兴，我指的不是“2*2”乘法，而是不使用计算器的任意长的数字链。我们人类小时候用笔和纸就可以做的事情。

5. 几何是关键问题。几何问题对于人工智能来说比其他类别容易得多。有大量的参赛者可以解决几何问题，但不会解决组合问题。今年我们几乎已经拥有了金牌级别的几何图形和 alphageometry，所以这没什么大不了的。

6. 爆炸新闻！计算机擅长数学，因为计算机在数学方面确实很糟糕。