OpenAI 模型解决了困扰人类 80 年的著名数学问题

我试图比 OpenAI 更清楚地解释 OpenAI 的解决方案。

5月中旬，OpenAI宣布内部人工智能模型反驳了 ErdÅs 单位距离猜想，这是离散几何中的一个著名问题，在过去 80 年里一直困扰着人类数学家。

OpenAI 让几位数学家提前获得了结果并发表了他们的反应. . . 蒂姆·高尔斯“数学界最负盛名的奖项菲尔兹奖获得者”写道，“毫无疑问，单位距离问题的解决是人工智能数学的一个里程碑。”

多伦多大学教授丹尼尔·利特写道：“这是人工智能自主产生的第一个结果示例，我发现它本身就令人兴奋，而不是作为领先指标。”

这可以说是人工智能系统第一次找到解决重大开放猜想的证据。这令人印象深刻，但我并不认为这是对人工智能在数学方面的先前发展轨迹的彻底突破。

三年前，法学硕士很难解决算术问题。LLM 直到去年才开始高中数学竞赛取得好成绩。

当我一月份参加联合数学会议（世界上最大的年度数学会议）时，我了解到人工智能系统开始为数学研究做出贡献，但仅限于有限的环境。将人工智能输出转化为可发布的定理需要大量的人类解释。

OpenAI 的新成果是这一进程的下一步。人工智能模型巧妙地应用了来自多个数学子领域的现有想法来创建完整的证明。但它并没有开创任何真正的新技术。结果是清理干净和扩展由人类数学家提出。

这预示着人类数学家和人工智能模型在中期的未来将相互补充：人工智能比任何活着的人类对过去的工作有更广泛的了解，并且更愿意研究不太可能奏效的繁琐的证明策略。但人类仍然可以更深入地思考任何一个问题并提出更有趣的问题。

这可能不会持续太久。人工智能系统在数学方面的进步如此之快，以至于我们尚不清楚十年后人类数学家将扮演什么角色（如果有的话）。

保罗·厄德斯是历史上最多产的数学家之一。他一生写了 1,500 多篇论文，是有史以来最多的。他最伟大的才能之一就是提出了简单易懂但根深蒂固的问题。

1946年，他推出了 单位距离问题。假设您在 2D 平面上有一些点，并且测量每对点之间的距离：

A diagram with five connected points. — 在此图中，有五个点和十对点。

三对恰好相距 1 个单位：AD、BE 和 CE。

我们能否重新排列这些点，使更多的点对恰好相距 1 个单位？

是的。例如，我们可以将点 A 和 D 移动到更靠近 B、C 和 E 簇的位置。通过更多的工作，我们可以进一步重新排列这些点，以便有七对恰好相距一个单位。但这是我们能做的最多的事情。

我们可以对 6 点、7 点等进行相同的分析。但随着点数的增加，问题很快就会变得太复杂而无法找到确切的答案。

Diagrams showing optimal arrangements for 5-9 points. — 信用：鲍里斯·阿列克谢耶夫等人。因此，ErdÅs 并没有询问给定数量的点到底有多少个单位距离，而是尝试计算 n 的长度为 1 的直线数量的上限和下限

� 点，假设 n 是一个很大的数。为了帮助计算下限，ErdÅs 假设这些点将布置在网格中。

这可能不是最佳布局，但如果他能够证明网格中的点具有一定数量的单位距离对，那么最佳排列必须至少具有该数量。

Three diagrams showing circles with different diameters, and their whole-number grid intersections. — 如果我们把网格变小，我们就可以让更多的网格点与单位圆相交。这给出了更多的单位距离。信用：凯·威廉姆斯 / 理解人工智能

最简单的选择是对网格进行间隔，使每个点与其正上方、下方、左侧和右侧的相邻点的距离均为 1。然而，ErdÅs 发现，如果考虑对角线，你可以做得更好。如果减小网格间距，则可以使每个点与更多相邻点的距离为 1。在上图中，如果网格间距为 1，则每个单独的点与四个相邻点（左图）相距一个单位。相反，如果网格间距为 â（如右图所示），则每个单独的点与 12 个相邻点相距 1 个单位：

An animation of nine circles adding diagonal lines over a grid. — 13×13 网格中九个中心点的距离一邻居的动画。您可以为网格中的其他点绘制类似的圆圈以获得剩余距离（一对），但圆圈上的某些点不会落在网格点上。信用：凯·威廉姆斯 / 理解人工智能

OpenAI 在其新结果的报告中包括一张令人困惑的图表，显示网格中的点以及连接它们的一堆线。如果我们像这样叠加一个圆圈，该图会变得更容易理解：

A circle on top of a 16-by-16 grid. — OpenAI 宣布人工智能反驳单位距离猜想的图表，我在该图表上叠加了一个显示距离的圆圈——一个点对应一个邻居。这里的网格间距是 1/±65，这会产生与网格上 16 个点相交的单位圆（或者如果网格更大的话）。信用：凯·威廉姆斯 / 理解人工智能

这是因为毕达哥拉斯定理指出，如果我们有一个点向右 a 个单位，在另一个点上方 b 个单位，那么这两点之间的距离 c 满足 a² + b² = c²。诀窍是选择某个数字 c2，以便有一大堆整数对 a 和 b，使得 a2 + b2 = c2。然后，如果我们缩小网格，使每个点与其相邻点的距离为 1/c，就会出现一堆单位距离。

例如，如果我们选择 c² = 25，则毕达哥拉斯方程可以通过 0² + 5² = 25 或 3² + 4² = 25 来满足。这对应于我之前展示的 12 个网格点圆，点位于 (0,5)、(3,4)、(4,3)、(5,0)、(-4,3)、(-3,4) 等。（例如，从技术上讲，这些长度都应除以 5 – (–, –)，但为了清楚起见，我将分母省略。）

OpenAI 的图表基于选择 c² = 65，可以通过 1² + 8² = 65 或 4² + 7² = 65 来满足。这意味着，如果网格间距为 1/±65，则每个点将与其他 16 个点相距 1 个单位：(1,8)、(4,7)、(7,4)、(8,1)、(-1,8)、(-4,7) 等等。如果仔细选择的话，较大的 c 值会产生更多的整数对角线，从而产生更多的单位距离对。

然而，如果 c² 与网格中的点数相比太大，那么许多潜在的一单位相距的邻居将位于网格之外。

简而言之，我们想要选择一个足够大但又不太大的 c。利用数论的见解，包括雅可比二平方定理ErdÅs 能够证明，最佳尺寸的圆将使单位距离对的数量增长得快于点的数量，但也只是勉强增长。

问题变成了“你能做得更好吗？”为了找到上限，ErdÅs 使用了来自一个完全不同的数学领域（称为图论）的论证来表明你只能有这么多的单位距离。但他的上限增长速度比他能够构建的最佳下限快得多。

埃尔德萨的猜想是，实际最优值比上限更接近下限。他预测但无法证明，单位距离对的最大数量的增长仅比点的数量快一点。

更准确地说，ErdÅs 推测单位距离的数量为 n^(1+o(1))。换句话说，对于足够大的 n，对于任何 ð > 0，单位距离的最大数量将小于 n^(1+ð)。这最终可能会比他的下限构造增长得快一点——对于某个常数 C，它是 n^(1 + C/(log log n))，但在相同的总体范围内。

证明他的猜测被称为单位距离问题。在接下来的 80 年里，埃尔德斯似乎是正确的。

然后 OpenAI 模型证明他错了。

埃尔德萨的猜想假设，至少对于大量点，方形网格可以产生与以其他方式组织点一样多的单位距离对。OpenAI 的人工智能证明了这一点是错误的，它证明了还有另一种更复杂的方式来组织 n 个点，从而允许更多对恰好相距一个单位。

正是因为新的点模式更加复杂，所以很难简洁地解释它。但您可以将其视为对 ErdÅsâs 网格的巧妙修改。

人工智能在高维空间中构建了一个网格，然后将这个更复杂的结构投影到二维空间中。AI 构造并没有使用带有 (1,3) 或 (-3,6) 等点的整数网格，而是使用一种称为代数整数的东西来构建这个更复杂的网格。事实证明，这种高维网格具有更丰富的结构，这使得人工智能可以将更多的单位距离打包到相同数量的点中。

很难说明这种点的替代排列，因为它只有在点数量非常多时才变得有利。但这里有一个以类似方式构建的更简单的点排列。你可以点击这里如果您想自己玩一下插图。

它有 1,345 个点，但仅产生 5,916 个单位距离，少于使用 ErdÅs 技术的 1,296 点方形网格产生的 7,632 个单位距离。但我认为它让人了解非网格的图案如何比方形网格产生更多的单位距离。

A non-grid-like pattern of points with red lines toward the center showing unit distances. — AI 模型排列的简化可视化效果。从中心发出的 12 条红线长度各为 1。单击交互式链接即可体验可视化效果。该图像是在 ChatGPT 的帮助下根据参与这项工作的数学家之一 Will Sawin 的想法创建的。信用：凯·威廉姆斯 / 理解人工智能

更复杂的模式会得到回报。虽然 OpenAI 模型的证明没有明确说明 n 个点可能有多少个单位距离对，但人类数学家 Will Sawin 能够显示它至少以 n 的速度增长^1.014。这可能看起来很小，但作为 n如果变得非常大，这个数字将比 ErdÅs 方法产生的计数大得多。

话虽如此，人工智能的结果并没有完全解决问题。我们的单位距离数量的最佳上限约为 n^1.333。需要做更多的工作来缩小这一差距。

如果您两周前（在 OpenAI 宣布之前）问我法学硕士对数学最新颖的贡献，我可能会指出阿尔法进化来自 Google DeepMind 的系统。

AlphaEvolve 利用法学硕士作为优化过程的引擎。如果你可以将数学问题转化为一段代码来优化（通常可以做到），那么对于某些类型的问题，法学硕士可能会找到比人类更好的解决方案。11 月，四位数学家（包括陶哲轩）发布了一个纸分析了 AlphaEvolve 在数学文献中 67 个优化问题上的表现。他们发现 AlphaEvolve 在某些情况下能够改进现有文献。

与之前的法学硕士贡献（例如文献综述）相比，这是自主性的一个进步，但它仍然需要人类将其构建为优化问题，并将人工智能的输出转化为可用的数学。并且只有某些类型的问题适合这种方法。使用 AlphaEvolve 无法轻松研究不包含要优化的数字的更多概念性问题。

因此人工智能公司一直致力于开发LLM系统，可以直接输出任何数学问题的正确解决方案。OpenAI 的成果是朝这个方向迈出的实质性一步。但这也符合之前人工智能辅助数学的模式。

一方面，其他公司也致力于解决 ErdÅ 的问题。因为埃尔德斯在他的职业生涯中提出了数百个问题，而且因为数学家托马斯·布鲁姆组织了一项工作，在www.erdosproblems.com– 人工智能公司将它们用作评估人工智能系统的试验场。一月份，剑桥大学本科生 Kevin Barreto 与一位朋友合作，要求 GPT-5.2 和 Harmonic 的亚里士多德制作出第一个自主解决方案ErdÅs 问题。5 月 22 日，即 OpenAI 宣布两天后，谷歌宣布其人工智能系统已经解决了 9 个开放的 ErdÅ 问题，其中两个已经开放了 50 多年。

需要明确的是，OpenAI 解决的问题比我刚才提到的任何其他工作都更令人印象深刻。但 OpenAI 的解决方案比标题结果所暗示的更符合过去的人工智能工作。

尽管单位距离问题众所周知，但 80 年来仍未得到解决的原因之一是大多数人认为埃尔德萨的猜想是正确的。但我们现有的数学工具还远远不能证明埃尔德萨斯的极限。因此，数学家预计该猜想的任何证明都将涉及重大的新想法或方法。

相反，正如我们所见，人工智能 反驳了这一猜想是通过对 ErdÅsâª 的初始结构进行扩展而得出的。这是一个聪明且非显而易见的解决方案，但它也与 AlphaEvolve 等系统所做的优化工作有一些相似之处。

这种动态反映在一些数学家的回应中。数学家蒂姆·高尔斯写道，当他第一次听说人工智能的结果时，他认为它已经证明了该定理。“我花了一个晚上调整我的世界观：如果人工智能能够提出这样的证明，那么也许数学家的一切很快就会结束。”

但第二天早上，高尔斯和其他外部评审员收到了一封关于结果的电子邮件，他意识到法学硕士“反驳了这个猜想，而不是证明了它，这让他松了一口气。”

OpenAI 的解决方案还具有两个特性，可以发挥人工智能模型相对于人类的优势。

首先，最终的解决方案依赖于应用来自完全不同的数学领域的复杂技术：代数数论。人工智能系统已经接受了大量数学知识的训练，并且有很多数学知识——因此他们比世界上任何人都更了解以前的数学工作。对于人类来说，要解决这个问题，他们需要具备相关的代数数论知识，同时还要对单位距离问题感兴趣，这是一种罕见的组合。

其次，推理过程非常辛苦，而且似乎不太可能成功，大多数人认为不值得这么麻烦。雅各布·齐默曼多伦多大学教授在 OpenAI 文档他曾短暂考虑过采取类似的方法来反驳这个猜想。但这种技术需要花费大量时间，而且常常行不通，因此他放弃了该项目。

另一方面，人工智能可以通过许多无效的证明策略，然后发现有效的策略。在模型找到解决方案之前，OpenAI 可能会多次运行该问题。事实上，OpenAI 的图表显示，即使使用最大的代币预算，内部模型也只能解决一半的问题。

需要明确的是，人工智能系统所做的事情仍然令人印象深刻。“查看完整的证明并在事后宣布它是显而易见的总是很诱人，”齐默尔曼后来在评论中说道。但正如我之前指出的，它也发挥了人工智能系统的优势。

从中短期来看，这表明人工智能模型将补充人类，但不会取代人类。人工智能系统将解决人类数学家提出的一系列问题，或帮助人类从看似不相关的数学领域中找到相关的方法。但它们不会立即取代人类在选择要提出的问题或开发全新技术方面的角色。

即使这个结果在很大程度上也是人类与人工智能的合作。虽然人工智能系统自己找到了证明，但人类数学家验证了结果。其他人提出了更好的书面证明来扩展人工智能的最初想法，就像我上面提到的威尔·萨温（Will Sawin）找到了一个明确的下界。

然而，目前尚不清楚这种互补性能持续多久。高尔斯在接下来的评论中探讨了当他听到人工智能反驳了这个猜想时所感到的宽慰是否合理。他或多或少得出的结论是，但在脚注中，他写道，他猜测“人工智能很快就会在其他活动上达到高水平，例如建立理论、制定定义和提出有趣的问题。”

在过去的一年里，我们已经从尚未在高中数学竞赛中获胜的人工智能系统转变为能够以有趣的方式推进数学发展的人工智能系统。人工智能系统在处理数学问题时似乎将继续变得更加自主。

与此同时，我们还没有充分探索当前模型在数学方面可以实现的目标。OpenAI 宣布后不久，密歇根大学博士后小马发现如果给予一点小小的提示，GPT-5.5 也能够证明 ErdÅ 是错误的。如果一个普遍可用的模型可以反驳这个著名的猜想，但没有人注意到，那么今天还有哪些其他发现没有人想到去尝试呢？

凯·威廉姆斯是一名记者了解人工智能，由 Ars Technica 校友 Timothy B. Lee 创立的 Substack 时事通讯。他的工作得到了支持塔贝尔奖学金. . . 订阅理解人工智能从蒂姆和凯那里得到更多。

OC

OpenAI 模型解决了困扰人类 80 年的著名数学问题

关于《OpenAI 模型解决了困扰人类 80 年的著名数学问题》的评论

发表评论

摘要

相关新闻

相关讨论