2025年联合数学会议(JMM)展示了数学与人工智能(AI)领域的交汇与分歧。数学家追求深刻理解与优雅证明,而AI研究人员更注重新发现与应用。尽管AI在数学文献整理和计算自动化方面展现出潜力,但其经验导向与数学的理论追求存在文化差异。数学家担忧AI的保密性与复杂性可能削弱数学的开放传统,强调理解重于技术成就。未来合作需在尊重各自价值观的基础上,搭建沟通桥梁。
原文点击标题: 今年1月,我参加了一个叫联合数学会议(JMM)的活动,主题是“我们决定我们的未来:人工智能时代的数学”。这个会议真的是一个学习和交流的好机会,我忙着在各个会议室之间跑来跑去,听了很多关于我熟悉的数学领域(比如模块化形式)的演讲,也学了很多新东西(比如知识图谱),还有很多关于数学和人工智能结合的讨论。
这个会议是由美国数学学会(AMS)和美国数学协会(MAA)一起办的,是美国最大的数学家聚会,有人甚至说这是“数学界的家庭聚会”。我从2009年开始就一直参加,每次都觉得很有归属感。但今年,我注意到做数学研究的和做工业界AI工作的人之间有些文化差异。这不是说谁好谁坏,我在两个领域都待过,都很尊重他们的工作。只是这两个领域受到的影响和现实情况不同,所以他们的看法、价值观和方法也不一样。
随着大家对人工智能在数学中的潜力越来越感兴趣,我有点担心这种热情并不总是建立在对数学真正理解的基础上。所以我想试着解释一下这些差异,希望能帮助大家更好地合作。我也在开发一些工具,希望能让研究更可靠。
什么是数学? 要理解这种文化差异,我们得先明白数学到底是什么。
保罗·哈尔莫斯(Paul Halmos)在《我想成为一名数学家》(1985年)中说得很好:“年轻人看到一个困难的定理证明时,会佩服这个成就,然后想:这个证明是怎么找到的?我怎么能想出这样的东西?书上没给任何提示。”
这揭示了一个基本事实:数学主要不是找证明,而是建立理解。
理查德·费曼在《别闹了,费曼先生!》(1985年)里讲了一个关于数学家的有趣观察,其实揭示了数学文化的一个深刻道理:
“在普林斯顿研究生院,物理系和数学系共用一个休息室……我记得有个人坐在沙发上,苦思冥想,另一个人站在他面前说:‘所以某某是真的。’‘为什么?’沙发上的人问。‘这很简单!这很简单!’站着的人说,然后他飞快地说出一连串逻辑步骤……速度很快,持续了大概十五分钟!最后站着的人说完,沙发上的人说:‘对,对。这很简单。’
“我们物理学家笑了,想弄明白。我们以为‘简单’的意思是‘被证明了’。所以我们跟数学家开玩笑说:‘我们有了一个新定理——数学家只能证明简单的定理,因为每个被证明的定理都是简单的。’”
但在数学界,“简单”这个概念其实反映了最高的追求:深刻理解一个概念,让最初看起来很复杂的东西变得显而易见。这就是为什么希尔伯特问题(曾经被认为是数学中最难的问题)的解决方案最终可以变成本科课程的快速推论。
这种追求理解的做法解释了为什么黑箱证明虽然偶尔被接受,但很少让人满意。证明的价值通常在于它能解释为什么结果是对的,而不仅仅是结果是对的。比如Apéry对ζ(3)无理性的证明:一开始很神秘,但最终导致了Beukers积分和其他适合更广泛理论框架的发展。
这种追求深刻理解的追求也解释了数学研究生常见的一种经历:向导师提问,得到的回答是:“读完这些书,几个月后再来。”有时候导师会很快给出答案,但这可能并不能培养正确的思考方式。
我甚至听过教授警告说,读错书会“导致大脑损伤”——这是一种形象的说法,意思是过早或错误的解释会阻碍更深的理解。就像高斯说的,数学精通“没有捷径”。
数学文化与价值观 数学非常重视优雅。G.H. Hardy在《数学家的辩白》中说,数学是一种美学追求,和诗歌或绘画一样。这种对美和优雅的关注不仅仅是风格问题——它往往能带来更深刻的见解和更广泛的概括。
这种文化还体现出一种深刻的谦逊,牛顿说过“站在巨人的肩膀上”。年轻的数学家很快意识到,尽管他们很有才华、有抱负,但他们得先彻底理解已有的东西。那些跳过这一步、觉得自己可以在不掌握基础的情况下彻底改变一个领域的人,往往会发现自己在圈子里被当成“怪人”。
数学本质上是开放和透明的。结果可以自由分享,方法可以公开讨论,整个社区可以一起验证和建立在已有的工作上。这种透明度不仅仅是哲学上的,它也很实用,让数学家们可以互相学习,一起推动领域的发展。
数学中的人为因素很重要,但常常被低估。虽然数学真理可能是客观的,但发现它们的过程却深深依赖于人性,依赖于直觉、创造力和合作。尽管理论上任何人都可以参与数学研究(因为它是开放和明确的),但导师的指导和大学里的社区仍然是无价的。导师不仅仅是指导研究;他们还帮助学生培养品味、直觉和阅读数学文献的能力。《普林斯顿数学指南》(2008年)里有一节叫“给年轻数学家的建议”,里面有迈克尔·阿蒂亚爵士、贝拉·博洛巴斯、阿兰·科内斯、杜萨·麦克杜夫和彼得·萨纳克的贡献,他们都强调了导师和社区在数学发展中的重要性。
数学中的归因也反映了这种人为因素。结果通常以人的名字命名,而不是用函数形式描述,比如“泰特论文”、“朗兰兹纲领”,或者CFKRS(Conrey、Farmer、Keating、Rubinstein和Snaith)这样的合作作品。这些名字通常不是自己起的,而是从社区里自然产生的。康斯坦斯·里德(Constance Reid)的《希尔伯特》(1970年)里有个著名的故事,希尔伯特在一次讲座后问:“希尔伯特空间到底是什么?”
数学文化的一个显著特点是作者按字母顺序排列。和很多科学领域不同,数学没有“第一作者”或“资深作者”的概念;贡献者只是按字母顺序排列。就像Ludo Waltman在《科学出版中按字母顺序排列作者的实证分析》(2012年)里说的,超过75%的数学论文是按字母顺序排列的,而在医学和生物学论文中,这个比例不到4%。但也有例外,比如Adleman坚持在RSA论文中排在最后。
这反映了数学中更深层次的文化价值观。
几位发言者指出,在导师和学生合作发表论文方面,数学和其他领域有很大的不同。虽然很多学科希望导师成为学生论文的合著者,但美国数学学会的指导方针是,智力贡献应该通过作者身份而不是角色或职位来体现。一位年轻的数学家描述了她听到另一个部门的同事认为她的导师会成为她论文的合著者时的震惊,并引用了她导师的回答:“如果我的贡献足以成为合著者,你就不会有太多的论文了,对吧?”就像彼得·萨纳克(Peter Sarnak)在《给年轻数学家的建议》(2008年)里说的:“数学博士生被期望独立工作,他们通常确实如此。”
数学的过程 数学需要极大的耐心。陶哲轩在他的博客文章“要有耐心”(2007年)里建议年轻的数学家,“从对问题的第一个基本洞察到完全解决问题可能需要几年时间。”很多数学家报告说,因为需要高度集中注意力,他们每天只能抽出大约两个小时真正高效的研究时间。在雅克·阿达玛的《数学领域的发明心理学》(1945年)里,他记录了数学思维通常需要长时间的无意识处理,中间穿插着顿悟的时刻。
读数学论文也很费力,有时候一整天才能读完一页。这不是被动阅读,而是主动参与:验证主张、通过例子思考,并把新想法和已有的知识联系起来。我最有效率的一天是盯着一张白纸几个小时,写下一个方程式,并为这一小步进展感到由衷的兴奋。
安德鲁·怀尔斯(Andrew Wiles)花了七年时间研究费马大定理,他反思了解决问题的过程:“也许我可以用穿越一座黑暗的未开发豪宅的旅程来最好地描述我做数学的经历”(PBS Nova,证明,1997年)。正在进行的形式化证明工作说明了数学形式化是多么复杂和耗费资源,而像Lean(一种形式化证明验证系统)里的mathlib这样的雄心勃勃的努力估计只包含了大约1%的已知数学定义和证明。
数学知识的规模让人震惊。最好的本科课程通常只让学生了解20世纪中期的数学发展。最后一个被认为对整个领域有全面了解的数学家是希尔伯特和庞加莱,一个多世纪以前。
数学语言的精确性和密度常常让其他学科的人感到震惊。就像诺曼·斯滕罗德(Norman Steenrod)在《如何写数学》(1973年)里说的,数学写作的目的是“用最少的阅读时间提供最多的信息”——这种效率必然会产生需要仔细解读的密集文本。詹姆斯·卡普特(James Kaput)对《数学与学习》(1987年)的研究表明,数学符号是一种认知工具,可以把复杂的概念压缩成可管理的符号。在我读博士期间,我在其他部门上课时亲身体验了这种文化冲击。工程和计算机科学课程通常会在前几节课里激发兴趣并解释潜在的应用。相比之下,我的研究生数学研讨会更像是学徒制——直接深入密集的材料,并理解掌握后会逐渐揭示底层结构及其应用。
我在斯坦福大学当助教时,最有价值的见解之一是认识到学生如何从根本上误解了数学的难度。很多人来的时候以为,只要学得够多、记得够多,他们就能用算法解决任何考试题。他们常常惊讶地发现,即使是老师也得花很多时间解决问题,尝试多种方法,经历失败才能找到答案。就像艾伦·舍恩菲尔德(Alan Schoenfeld)在他的里程碑式著作《数学问题解决》(1985年)里记录的,数学专业知识的特点不是记忆,而是战略思维、启发式方法和对问题解决过程的元认知意识。
人工智能与数学 在JMM上,大家讨论了很多AI如何为数学做贡献。有趣的是,大多数数学家表示,他们感兴趣的不是AI创造新数学,而是处理和组织已有知识——帮助连接不同领域、在子领域之间转换符号,以及自动化常规计算。
Yann LeCun的演讲讨论了基于下一个标记预测的大型语言模型在数学推理中的局限性,同时强调了JEMA等更有前景的方法。几位发言者指出,AI工具对于搜索和组织快速发展的数学文献可能特别有价值——很多人认为这个挑战通过传统方法越来越难应对。
不同的价值体系 一个小组分享的趣闻轶事凸显了文化差异:
- 当AI系统重现已知的数学结果时,数学家们很兴奋(认为这是对系统能力的验证),
- 而AI研究人员却很失望(他们希望有新发现)。
这反映了根本不同的目标:
- 数学家们寻求对已有事实的更深入理解,数学家们认为这是对系统能力和理解已有数学潜力的验证
- 而AI研究人员往往优先考虑新结果。AI研究人员则希望有新发现。
几位发言者讨论了数学相关性的挑战:在可以证明的无数真实陈述中,哪些是重要的?
数学不仅重视真实和可证明的结果,还重视“我们关心”的结果——这个判断需要数学品味、背景Context和社会价值观。
大家对AI在日常数学工作中的潜力充满热情。罗伯特·格里斯特(Robert Ghrist)用AI加速教科书写作的经验(详见《面向在职数学家的实用AI》)引起了特别兴趣,认为这是一种支持而不是取代数学思维的实用应用。
形式化方法和自然语言方法之间的争论反映了另一种紧张关系:
- 一些数学家支持像Lean这样的形式化证明系统,它提供严格的验证,但需要翻译成特定的形式语言。
- 另一些人则主张自然语言方法,它更符合数学家通常的交流方式。
这两种方法都有优点,但它们反映了不同的优先事项和价值观。
AI研究和数学之间最根本的区别可能在于它们的知识生成方法:
AI研究(尤其是深度学习)一直以经验为主。就像几次演讲中指出的,这种经验重点往往和传统的理论框架矛盾。弗拉基米尔·瓦普尼克(Vladimir Vapnik)的统计学习理论是很多经典机器学习的基础,他在1998年的书里对神经网络表示怀疑,认为它们在理论上应该无法完成很多复杂任务。
张等人在2017年发表的有影响力的论文《理解深度学习需要重新思考泛化》直接面对了这种脱节,记录了深度学习如何从经验上取得成功,尽管理论上它不应该成功。
未来的影响和担忧 一个问题引起了特别关注:如果AI系统证明了像黎曼猜想这样的重大猜想,但这个证明对人类来说太复杂,无法理解,会发生什么?这样的结果会让人满意吗?它会促进数学理解吗?大家似乎一致认为,虽然这样的证明可能在技术上解决这个猜想,但它无法提供数学家真正寻求的更深入的理解。
一些AI研究人员自信地预测,AI将在五年内解决一个实质性的未解问题——很多数学家对此持怀疑态度,这不一定是质疑AI的能力,而是质疑什么才是有意义的数学进步。
大多数数学家认为,没有概念进步的技术成就是不完整的。