数学家陶哲轩在形式证明帮助下发现论文中错误


数学家陶哲轩在Lean4形式化证明时发现已发表论文中的错误:

陶哲轩在用Lean4发现了一个小错误:论文论证中出现的表达式 12logn-1n-k-1 在 n=3,k=2 的情况下实际上是发散的。幸运的是,这个问题只影响到较小的 n 值,对于 n≥8 的情况,整体论证仍然成立,更小的 n 值可以用更粗糙的方法处理。陶哲轩将添加一个脚注,承认之前版本的论证略有错误,这是在 Lean 中通过形式化发现的。

他在本月初开始在 GPT4 的帮助下学习 Lean4

使用 Lean4 等形式化证明系统来验证数学证明、捕捉错误和提高严谨性的问题。

陶哲轩利用Lean发现了他最近一篇论文中的一个小错误。交互式定理证明器允许通过逐步证明语句来探索思想,而战术语言等工具则有助于实现常规步骤的自动化。

目前正在开展一些工作,将语言模型与证明助手连接起来,帮助提出策略建议,并有可能找到证明,不过这仍然具有挑战性。

形式化有助于解决历史上由于定义的细微差别而产生的问题。随着时间的推移,形式化的程度可能会提高,从而有助于扩展现有成果和发现。

对于想要简单了解 Lean4 的人来说,自然数游戏非常棒: https: //adam.math.hhu.de/#/g/hhu-adam/NNG4

Lean4 与 TLA+ 或 Alloy 有何不同?
Lamport 的 TLA+更多地是为试图设计系统、写下规格并推理事物如何动态运行的软件人员而设计的。
用于创建形式规范,围绕状态机中的程序行为。TLA+ 以清晰的方式让人有抽象概念。

Lean4 主要用于写下数学证明,而很少用于软件(尽管根据库里-霍华德对应关系,数学证明和程序具有等价性,因此界限有点模糊)。有“mathlib”,它就像一个经过正式验证的数学标准库,人们可以在新的证明中做出贡献和使用。
最近批准了一项多年的努力,开始在Lean4 中形式化费马大定理的证明.

Lean 4 的一个很酷的事情是它也是一种编程语言,使用与证明相同的语法,使您可以轻松地考虑证明您编写的程序的正确性属性。Lean 4 的大部分内容及其策略都是用 Lean 4 编写的(尽管此时几乎所有代码都没有任何相关的证明)。
Leo de Moura 也希望将 Lean 4 用于软件验证。

都打算发展为通用编程语言。

形式验证好处
形式验证几乎是消除 bug 的灵丹妙药,即使它不是 100%(没有什么是)。

它在消除错误方面肯定比模糊的哲学立场要好得多。哲学上会说:“默认情况下使事情安全”(这是什么意思?)或“当你处于糟糕的状态时中止”(你怎么知道你处于“糟糕的状态”) “状态?

形式验证减少了软件开发的艺术性,编程不再是一种手工艺,不再是手工作坊了。

banq注:形式与内容分离,用形式验证内容

逻辑性是通过形式化表达的,不是文字中有 “如果 因此 所以”等字眼就有逻辑,也不是用数学公式推导就有逻辑性,公式与公式两个上下文之间的逻辑一致性需要形式验证,确保整个体系逻辑一致,不前后矛盾,没有辩证反复,没有强词夺理。