英语轻松读发新版了,欢迎下载、更新

人工智能程序播放了漫长的游戏来解决数十年的数学问题

2025-02-12 21:22:55 英文原文

作者:by Whitney Clavin, California Institute of Technology

an infinite chess game
图片来源:AI生成的图像

一场国际象棋比赛要求其玩家考虑多年来掌握的计算机程序掌握的技能。早在1996年,IBM超级计算机就赢得了当时的世界国际象棋冠军加里·卡斯帕罗夫(Garry Kasparov)。后来,在2017年,由Google DeepMind开发的人工智能(AI)计划称为Alphazero,在训练自己训练之后以在几个小时内玩游戏后,胜利了当时最好的计算机国际象棋引擎。

最近,一些数学家已经开始积极地追求一个问题,即AI计划是否也可以帮助破解世界上最艰难的一些问题数学但是,尽管平均的国际象棋比赛持续约30到40个动作,但这些研究级的数学问题需要解决一百万或更多步骤或动作的解决方案。

在纸上出现arxiv由加州理工学院的Sergei Gukov领导的Preprint Server是理论物理和数学教授John D. MacArthur教授,描述了开发一种新型的机器学习算法,该算法可以解决需要非常长的步骤的数学问题。团队使用了他们的解决与总体数十年历史的数学问题有关的问题家庭,称为安德鲁斯·柯蒂斯(Andrews)猜想。从本质上讲,算法甚至比Alphazero这样的先进程序都可以思考。

研究第一作者阿里·谢赫(Ali Shehper)说:“我们的计划旨在寻找一系列罕见且难以找到的步骤。“这就像试图通过地球大小的迷宫找到自己的方式一样。这些是您必须测试的很长的路径,只有一条途径可行。”

使用AI来解决数学问题已经变得越来越流行。Google DeepMind的字母隔板在2024年国际数学奥林匹克运动会(一项高中数学竞赛)中表现为银牌获得者的水平。Openai的O3计划最近通过数学,科学和计算机编程中的基准问题进行了推理。

由加州理工学院领导的数学家不专注于常规问题,而是他们领域中最艰难的问题。在新研究中,他们使用AI解决了安德鲁斯·柯蒂斯(Andrews Curtis)猜想中的两个问题家族,这是60年前首次提出的群体理论问题。

尽管他们没有解决主要的猜想本身,但他们反驳了问题家庭,被称为潜在的反例,这已经开放了大约25年。他们还在另一个已经开放了44年的反示例家族中取得了重大进展。反例基本上是数学案例,可以反驳原始猜想。如果反例本身被驳回,那么原始猜想仍然可能是正确的。

Shehper说:“排除一些反例使我们对原始猜想的有效性有信心,并有助于建立我们对主要问题的直觉。这为我们提供了新的思考方式。”

古科夫说,这些数学问题导航就像通过需要数千,数百万甚至数十亿个步骤的复杂路线“从A到B”。他比较了解决一个难以置信的复杂魔方的问题。

“你能拿起这个炒romik的魔方,将其恢复到原始状态吗?您必须测试这些很长的动作序列,并且您不会知道您是否在正确的路径上直到最后,”古科夫说,他也是加州理工学院新的Richard N. Merkin纯和应用数学中心的主任。

AI program plays the long game to solve decades-old math problems
相对于其初始长度沿AC琐事路径的最大长度的最大增加。绘制增加的绘制是左侧介绍的初始长度的函数,也是右侧n的函数。信用:arxiv(2024)。doi:10.48550/arxiv.2408.15332

该团队的AI计划学会了一系列的动作序列,研究人员称之为“超级动作”是出乎意料的,或者研究人员所说的异常值。这与像chatgpt这样的AI程序的运作方式形成鲜明对比。

古科夫说:“如果您要求Chatgpt写一封信,它将提出一些典型的东西。不可能提出任何独特而高度原创的东西。这是一个很好的鹦鹉。”“我们的计划擅长提出异常值。”

为了培训他们的AI计划,研究人员使用了称为增强学习的机器学习模型。首先,团队展示了AI简单的问题要解决,然后逐渐使它越来越困难。

Shehper解释说:“它尝试了各种动作,并为解决问题而获得了回报。”“我们鼓励该计划做更多的事情,同时仍然保持一定的好奇心。最终,它制定了比人类能做的更好的新策略。这就是加强学习的魔力。”

目前,AI计划通常不太擅长预测具有巨大后果的遥远的罕见事件,例如金融市场崩溃。该团队的新算法也无法做出这样的预测,但它可能包含对这种性质进行聪明预测所需的种子。古科夫说:“基本上,我们的计划知道如何学习学习。”“这是在框外思考。”

该团队的新算法已经在数学社区中引起了很大的兴趣。

古科夫说:“我们在数十年历史的数学领域取得了很多进步。”“进步相对较慢,但现在忙碌而繁华。”

实际上,三位新数学家加入了加州大学圣塔芭芭拉分校的卢卡斯·法甘(Lucas Fagan)和张汉(Zhenghan Wang),以及中国天津(Tianjin)的南卡伊大学(Yang Qiu),该小组发布了另一份预印本文件,报告了解决更多潜在的家族属于安德鲁斯柯蒂斯猜想的反事实。

该团队的方法不是扩展AI模型,而是要找到不需要大量计算能力的新的聪明技巧和策略。

研究人员说:“我们试图在小型计算机上表现出良好的性能,这很容易获得小型的学术合作,以便我们的所有同事都可以轻松地重现这些结果。”

更多信息:Ali Shehper等人,是什么使数学问题难以加强学习:一个案例研究,arxiv(2024)。doi:10.48550/arxiv.2408.15332

期刊信息: arxiv

引用:AI计划的长期游戏解决了数十年历史的数学问题(2025年,2月12日)检索2025年2月13日摘自https://phys.org/news/2025-02-02-ai-plays-game-decades-math.html

该文档具有版权。除了为私人研究或研究目的的任何公平交易外,没有未经书面许可,可以复制部分。内容仅用于信息目的。

关于《人工智能程序播放了漫长的游戏来解决数十年的数学问题》的评论


暂无评论

发表评论

摘要

由加州理工学院(Caltech)的Sergei Gukov领导的团队开发了一种新的机器学习算法,该算法可以解决需要长时间步骤的复杂数学问题,超过了Alphazero之类的程序。他们与安德鲁斯 - 库尔提斯(Andrews – Curtis)猜想有关的AI的AI家族尚未解决了25年以上。使用增强学习,他们的程序在寻找意外解决方案(“超级动作”)方面表现出色,这是其他AI系统中通常不见的功能。这一突破激发了数学社区的精力,并通过与来自各个机构的新成员扩大团队来取得进一步的进步。