数学的边缘
作者:Matteo Wong
在过去的几个月里,一些研究人员开始提出同样的挑衅性主张:他们使用生成式人工智能工具来解决一个以前未解答的数学问题。
最极端的承诺——人工智能协助解决数学中一些最困难的问题——很可能最终只是空洞的炒作。但许多人工智能编写的解决方案已经得到检验,尽管这些解决方案远没有那么受人称赞。这些是匈牙利数学家 Paul ErdÅs 提出的许多 ErdÅs 问题的 1,000 多个数学问题的答案,这些问题是用 ChatGPT 等生成式 AI 模型编写的。OpenAI 很快就取得了胜利:“GPT-5.2 Pro 解决了另一个开放的 ErdÅs 问题”,OpenAI 总裁 Greg Brockman发布一月 X 日。“对于数学和科学进步来说,这将是疯狂的一年!”(OpenAI 和大西洋报有企业合作伙伴关系。)
围绕这一消息的兴奋很大程度上源于这些人工智能编写的证明的裁决者:加州大学洛杉矶分校教授陶哲轩,他被广泛认为是世界上在世的最伟大的数学家。他的认可似乎使生成式人工智能的最大承诺合法化——推动人类知识和文明的前沿。当我本月早些时候打电话给陶,询问他对人工智能可以为数学带来什么的看法时,他的脾气更加暴躁了。他告诉我,人工智能生成的 ErdÅ 解决方案令人印象深刻,但并不是压倒性的:这些机器人在功能上已经取得了一些“廉价的胜利”,Tao 说。
长期以来,陶一直对人工智能工具能为他的领域做些什么感到好奇,但对此持保留态度。我们第一次发言2024 年秋天,陶将聊天机器人比作“平庸,但并非完全无能”的研究生。大约六个月后,他告诉我,这些模型在某些类型的高级数学推理方面已经变得更好,但缺乏创造力并犯了一些微妙的错误。但在我们最近的谈话中,他更加乐观。人工智能可能还无法解决世界上所有重大数学问题,但聊天机器人已经可以与人类数学家合作。他说,在这个过程中,这项技术正在开辟一种不同的“数学计算方式”。
为了篇幅和清晰度,本次对话已被编辑。
黄马泰:最近,ChatGPT 解决一些 ErdÅs 问题的能力引起了很多人的兴奋。在过去一年左右的时间里,您如何看待生成式人工智能的数学能力的发展?
陶哲轩:有一大群人非常非常想要人工智能的成功故事。然后还有一群平等且相反的人想要否认所有人工智能的进步。我们所看到的是介于两者之间的一个非常复杂和微妙的故事。
特别是在这些埃尔德问题中,有一小部分我们真正想要解决的引人注目的问题,然后还有一长串非常模糊的问题。人工智能非常擅长的是系统地探索这条长尾并解决最简单的问题。但这与人类的风格非常不同。人类不会系统地解决所有 1000 个问题,然后选择 12 个最简单的问题来解决,而这正是人工智能正在做的事情。
这些问题之间确实存在巨大的难度。看看人工智能迄今为止自行解决的问题,就像,哦,好吧,他们使用的是标准技术。如果有专家研究半天,也能搞清楚。已经有了更复杂的解决方案,这些解决方案是由人工智能辅助的。我认为在短期内,我们将通过纯人工智能方法在简单问题上快速取得很多成果。然后在接下来的几个月里,我认为我们将有各种混合的人类人工智能贡献。
我正在从一些出现的证据中学习。我喜欢阅读它们——也许它使用了 1960 年某篇论文中我没有意识到的技巧。所以它可能不是超级非常有创意,但它是新的,它可以做一些人类专家在研究这个问题时所忽视的事情。
黄:你已经书面的当人类数学家解决一个新问题时,无论他们是否成功,他们都会产生该领域其他人可以借鉴的见解——这是基于人工智能的证明无法提供的。怎么会?
涛:这些问题就像您徒步前往的遥远地方一样。在过去,你必须去旅行。您可以放置其他人可以遵循的路线标记,还可以制作地图。
人工智能工具就像乘坐直升机将你送到现场。你会错过旅程本身的所有好处。你就直接到达目的地了,这实际上只是解决这些问题的价值的一部分。
黄:当您今天思考这些模型的能力时,除了使非数学家能够解决更高级的问题之外,它们还能为您的领域做出什么贡献?
涛:如今,有很多非常乏味的数学类型是我们不喜欢做的,因此我们寻找聪明的方法来绕过它们。但人工智能会很高兴地完成这些繁琐的计算。当我们将人工智能与人类工作流程相结合时,我们就可以轻松越过这些障碍。
我还认为数学家将开始进行更大规模的数学研究。思考一下科学领域的案例研究和人口调查之间的区别。如果你要研究 18 世纪的一种疾病,如果它是一种罕见的疾病,你可能会研究一名患有这种疾病的患者,记录他们的所有症状并做详细的笔记。但在 21 世纪,你可以进行临床试验,给 1,000 人服用一种药物,并进行统计,获得有关药物功效的更精确信息。
数学在很大程度上仍然处于案例研究的水平。一篇论文会提出一两个问题,并以一种非常手工的、密集的方式研究它们。这就是我们的风格。但人工智能工具的作用是人口研究。
黄:您是否对人工智能模型在数学能力方面取得的进步感到惊讶?
涛:有点惊讶。很多事情已经发生了,我预料到会发生,但它们比我预想的要提前一点。不是很多。
例如,在 2023 年,我写了这个文章微软预测,到 2026 年,人工智能将成为值得信赖的共同作者,其贡献将达到技术论文共同作者的水平。这篇论文得到了不同的回应:人们要么说我太雄心勃勃,要么说我太悲观。但我认为这基本上与日程安排完全一致。我们基本上看到人工智能的使用与我期望的初级人类合著者做出的贡献相当,尤其是那些非常乐意做繁重工作并解决许多乏味案例的人。
黄:您希望或期望在未来一两年内从生成式人工智能模型中看到哪些改进?
涛:我们希望鼓励负责任的人工智能使用并阻止不负责任的人工智能使用,存在一个中间立场。这是一条微妙的路线。但我们以前就这么做过。数学家通常使用计算机进行数值计算,当计算机辅助证明首次出现时,最初出现了很多强烈反对,因为你怎么能相信计算机代码呢?但我们花了 20 或 30 年才弄清楚这一点。不幸的是,现在的时间表要压缩得多。所以我们必须在几年内找出我们的标准。通常情况下,我们的社区发展得不会那么快。
一件对数学界有帮助的非常基本的事情是:当人工智能给你一个问题的答案时,通常它不会给你任何好的指示来表明它对这个答案的信心有多大,或者它总是会说,我完全确定这是真的。人类就是这样做的。他们对某件事是否有信心都是非常重要的信息,可以尝试性地提出一些你不确定的东西,但重要的是要表明你对此不确定。但人工智能工具并不能准确评估自己的信心。这降低了它们的实用性。我们希望有更多诚实的人工智能。
此外,许多人工智能公司都痴迷于按按钮、完全自主的工作流程,你把任务交给人工智能,然后你就去喝杯咖啡,回来后问题就解决了。这实际上并不理想。面对困难的问题,你确实希望人类和人工智能之间进行对话。人工智能公司并没有真正促进这一点。
如果我们至少能与一些愿意开发更多互动平台的科技公司合作,那将更容易受到人们的欢迎。我们不想沦为只按按钮的人。