AI深夜自动破解埃尔德什百年猜想！数学形式化革命已至

2025年，AI系统Aristotle首次自主解决埃尔德什开放问题，标志数学形式化进入全自动时代。从手动验证到AI流水线，数学研究范式正在被彻底重构。

人类数学正被AI彻底重构：Erdős难题迎来“AI自动破解”时代

2025年12月初的这个冬天，一个人工智能系统在深夜自动运行数小时后，醒来就发现它已经解开了一道被传奇数学家保罗·埃尔德什（Paul Erdős）列为“开放问题”的数学谜题？

更震撼的是，这个证明不仅简洁优美，还被数学界誉为“来自《天书》”（The Book）的解法！这不是科幻小说，而是正在真实发生的数学革命。

今天这篇文章，就带你深度走进这场由AI驱动的数学形式化浪潮，看看人类如何借助大模型与形式验证工具，把百年前的猜想变成可验证、可传播、甚至可“自动生成”的数字真理。

埃尔德什的问题宇宙：1100道谜题背后的文化密码

要说清楚这一切，我们必须先回到一个名字：保罗·埃尔德什。这位20世纪最具传奇色彩的数学流浪者，一生没有固定住所，靠朋友收留、靠咖啡因驱动，发表了超过1500篇论文，合作过500多位数学家。

他不仅做研究，更热衷于提出问题——有些简单到高中生能懂，有些则深不可测。他甚至为某些问题悬赏金钱，从几十美元到几千美元不等，以此激励后人思考。

如今，在 erdosproblems.com 这个由数学家托马斯·布鲁姆（Thomas Bloom）于2023年5月创建的网站上，已经收录了超过1100道埃尔德什提出的问题。其中约40%已被解决，约240道问题的陈述已被形式化为Lean语言（一种现代定理证明语言），17个问题的完整解法也已完成形式化验证。

更酷的是，2025年8月，该网站新增了论坛功能，迅速引爆全球数学爱好者的讨论。

与此同时，谷歌DeepMind启动了“形式化猜想”（Formal Conjectures）开源项目，专门收集包括埃尔德什问题在内的各类数学猜想的形式化表述。

托马斯·布鲁姆还与菲尔兹奖得主陶哲轩（Terence Tao）联手，推动将这些猜想与“整数数列在线百科全书”（OEIS）建立链接。如今已有260多个问题成功关联至OEIS条目。这一切，正在构建一个前所未有的“可计算数学宇宙”——问题可查、解法可验、逻辑可追溯。

从零到Lean：人类如何亲手将猜想变成机器可读的证明

故事的起点其实并不依赖AI。

早在2022年，托马斯·布鲁姆与巴维克·梅塔（Bhavik Mehta）就完成了对“问题47”（关于单位分数的分解）的完整形式化。有趣的是，布鲁姆在开始时对Lean一无所知，完全是“边做边学”。

他们的工作不仅是首个被形式化验证的解析数论新成果，也是“圆法”（circle method）首次在形式系统中实现，更是首个被正式验证的埃尔德什问题解法。

他们在论文中写道：“这证明了Lean和其配套数学库Mathlib已足够成熟，能在与传统论文发表同步的时间尺度上完成新研究的形式化。”这个“证明即代码”的理念，正是当今数学形式化运动的核心精神。

此后几年，虽有零星进展——如对问题77、216及著名的哈德维格-尼尔森问题（问题508）的部分形式化——但整体节奏仍较缓慢。
直到2025年夏天，“形式化猜想”项目上线，以及 erdosproblems.com 论坛激活，才真正点燃了社区协作的火种。
例如，2025年秋季，斯汀·坎比（Stijn Cambie）、维耶科斯拉夫·科瓦奇（Vjekoslav Kovač）与陶哲轩合作解决了问题379，并“亲手”用Lean完成了形式化；几天后，陶哲轩又独立解决了问题987（事后才知埃尔德什本人早已解决），同样手动完成Lean验证。

这些早期工作虽无AI介入，却为后续爆发打下了坚实基础。

AI初登场：用ChatGPT“vibe code”出Lean证明

真正的转折点出现在2025年下半年。作者鲍里斯·阿列克谢耶夫（Boris Alexeev）与达斯汀·米克森（Dustin Mixon）合作解决了“问题707”。

在完成传统数学推导后，他们尝试了一种前所未有的方式：直接让ChatGPT“凭感觉”（vibe code）生成Lean代码。
他们在论文中坦承：“我们感觉自己正在尝试一种全新的数学研究范式——将大语言模型与形式验证结合，产出既重要又可认证正确的结果。”

这一尝试引发连锁反应。有数学家反馈，三年没碰Lean，如今再回来看，整个生态已焕然一新：Mathlib库更完善，Lean语言更友好，加上LLM辅助，形式化效率提升数倍。受此启发，陶哲轩也用类似方法，让ChatGPT辅助完成了对奥列格·皮胡尔科（Oleg Pikhurko）所解“问题613”的形式化。

值得注意的是，此时的AI还只是“辅助”——人类仍需主导逻辑结构，AI负责语法转换和细节填充。

Aristotle登场：形式化进入“自动驾驶”时代

但真正的革命，来自一个叫Aristotle（亚里士多德）的AI系统——由Harmonic公司开发，2025年中向公众开放。

最初，Aristotle只能完成Lean中的“sorry”占位符，即给定一个已形式化的定理陈述，它能尝试生成证明。
作者用它成功验证了吴锡川（Wu Xichuan）在论坛上提出的“问题105”的反例。
此前他用纯ChatGPT失败，而Aristotle一试即成。
原因很简单：该反例虽难构造，但验证逻辑极其直接。

很快，Aristotle升级了“非形式模式”（informal mode）——能直接读取用自然语言或LaTeX写成的数学文本，并自动将其转化为Lean形式化证明！

这彻底改变了游戏规则。

作者与陶哲轩、Gemini DeepThink、Wouter van Doorn等人合作，用此功能完成了“问题367”部分解法的形式化。
更疯狂的是，作者随后搭建了一个自动化流水线：人工选定一个问题 → 让ChatGPT解释其解法 → 用Aristotle将解释文本自动形式化 → 与“形式化猜想”项目中的定理陈述拼接 → 交给Lean验证 → 自动推送到GitHub，甚至自动生成论坛评论！
这套流程首次在“问题645”上完美运行。

虽然后续十几次尝试中常需人工干预（流水线仍脆弱），但效率已从“半年”缩短到“几小时”。

如今，Aristotle已贡献了 erdosproblems.com 上大多数公开的形式化解法。更重要的是，整个过程几乎“无人值守”——你提交任务，去睡觉，醒来就能看到机器给你一份可验证的数学证明。

AI自主解题：深夜醒来，发现AI已破解埃尔德什开放问题

如果说辅助形式化是“增强人类”，那么2025年12月初的事件则是“取代人类”的开端。

作者某周五晚上手动挑选了几个开放问题，启动Aristotle后就去睡觉了。第二天一早，他收到邮件：Aristotle成功解决了“问题124”！这道题出现在埃尔德什1997年出版的两本问题集中（他于1996年去世），一直被视为开放问题。

经过仔细核查，作者确认：Aristotle的证明完全正确。

尽管后来发现，埃尔德什可能本意是另一个稍有不同的版本（因此问题陈述已被修改），但就当前形式化表述而言，AI确实“首次自主解决”了一个公认的埃尔德什开放问题。更令人震撼的是，这个证明极其简洁——被众人称为“奥数级别”，但作者坚持认为，它更应被称作“来自《天书》”——埃尔德什曾说，上帝有一本记录所有最美证明的《天书》，而这个解法正配得上这份荣耀。

紧随其后，凯文·巴雷托（Kevin Barreto）在不知情的情况下重新解决了“问题481”（原解者为1982年的David Klarner），并请Aristotle完成两件事：形式化他的证明，并尝试自主求解。结果双双成功！这意味着，Aristotle不仅能复现人类解法，还能独立发现新解。多个团队随后声称也实现了对这些问题的全自动求解。

此外，谷歌DeepMind的AlphaProof系统（可直接输出Lean代码）也为社区贡献了新知：为“问题730”构造了有趣示例，为“问题198”找到了漂亮反例。虽然这些证明常需人工重写以提升可读性，且因问题陈述随后被修改，目前尚无AlphaProof生成的解法被正式归档，但其潜力毋庸置疑。

形式化的暗礁：AI也难逃“误形式化”陷阱

然而，作者也坦承：形式化之路并非坦途。他总结了三类“误形式化”（misformalization）：

低级错误：如“问题480”的形式化中误写“m ≠ 0”应为“n ≠ 0”，Aristotle竟利用此漏洞构造出反例；还有不等式方向写反、忽略平凡零解、量词顺序颠倒等。这类错误在Lean中比Python等语言更常见，因数学家对Lean不熟，且代码不“运行”而是“验证”。

缺失假设：1994年Ahlswede与Khachatrian对“问题56”的反例依赖参数212，但作者形式化时，Aristotle用参数2就找到反例——原来原猜想隐含了一个未明说的假设。补上后，证明才成立（过程中作者自己还犯了“差一错误”）。

高层误解：“问题124”本身可能就属此类——埃尔德什晚年修改问题时，无意中弱化了条件，导致问题变得过于简单。AI解出的正是这个“简化版”。

作者强调：AI工具不仅能发现低级错误，更能揭示数学家思维中的盲点。尤其是第三类，能帮我们聚焦真正核心的数学结构。

形式化不是终点，而是新协作范式的起点

所以，这一切意味着什么？

有人或许会说：埃尔德什问题多属初等问题，不具代表性。
但作者反驳道：关键在于社区力量与数据基建。

埃尔德什问题之所以成为AI试验田，是因为：
（1）全球数学家珍视这些问题，乐于讨论与协作；
（2）社区已建成高质量、双语（自然语言+Lean）的问题库。

随着更多数学领域完成形式化（即向Mathlib贡献定义与定理），同样的故事将在代数几何、拓扑、PDE等深水区上演。

作者呼吁：如果你想推动自己领域的形式化，不妨学习埃尔德什社区的经验——将你的猜想提交至“形式化猜想”项目；积极参与Mathlib建设；构建带论坛的问题数据库。因为只有当知识被结构化、可计算，AI才能真正成为你的研究伙伴。

这场变革的核心启示是：未来的数学，不仅是写在纸上的推理，更是可执行、可验证、可进化的代码。而AI，正成为连接人类直觉与机器严谨的桥梁。

AI深夜自动破解埃尔德什百年猜想！数学形式化革命已至

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道