美国国防高级研究项目局(又名DARPA)认为,数学进展不够快。
因此,为了加速或“指定”数学研究的速度,DARPA本周举行了一项提案者日活动,以与技术社区互动,希望与会者能够准备提交一旦实际广泛的机构公告(BAA)招标提交的提案。哇,在那里放慢脚步,山姆大叔。
DARPA的项目被称为Expmath,旨在在人工智能的帮助下开始数学创新,或者为那些偏爱较少术语的人进行机器学习。
该机构在其网站上在其网站上解释说:“指定数学的目的(Expmath)是通过开发一个能够提出和证明有用的抽象的AI合着者来从根本上加速纯数学的进度率。”
DARPA计划经理帕特里克·沙夫托(Patrick Shafto)在弗吉尼亚州阿灵顿的DARPA会议中心举行的活动中发表讲话,通过展示了数学在1878年至2018年之间的慢速进展,从而加速了数学研究。
这些领域经历了变化,但数学却没有,我们想做的就是将这种变化带入数学
在此期间,数学进步是根据年度科学出版物数量来衡量的,以低于1%的速度增长。
这是基于研究Lutz Bornmann,Robin Haunschild和Rã¼DigerMutz于2021年进行,他们计算了不同学科的科学增长总体增长率为4.10%。
科学研究也带来了创新的潮流。例如,在生命科学中,让·巴蒂斯特·拉马克(Jean-Baptiste Lamarck)(1744-1829)和查尔斯·达尔文(Charles Darwin)(1809-1882)的时代,在1806年至1848年之间的时期的出版增长率为8.18%。在物理和技术科学中,在1793年至1810年之间记录了25.41%的增长,这一时期与约瑟夫·路易斯·拉格兰奇(Joseph-Louis Lagrange)(1736 1813年)的重要工作相吻合。
沙夫托说:“因此,这些领域经历了变化,但数学却没有,我们想做的就是将这种变化带入数学。”在他的演讲中。
DARPA提出的创新加速是人工智能。但是问题是AI并不是很聪明。它可以进行高中级数学,但不能进行高级数学。
正如Shafto的一张幻灯片中所述,“尽管有推理能力声称,但Openai O1(草莓)仍然在基本数学上失败。”
但是,Expmath的目标是使AI模型能够:
AI研究所喷泉居所的创始人兼首席执行官Robin Rowe参加了该活动。正如他向他解释的那样寄存器,他主修大学,但觉得很乏味,因此他进入了计算机科学。
尽管如此,他说,尽管如此,他发现这个目标似乎是创造一个可以作为同事的AI数学家,这与能够帮助证明的研究生相当。
也就是说,他允许的能力水平高于AI模型中目前所表现出的能力。
Rowe说:“我们现在已经经过了思考。”“因此,这就像对类固醇的经过思考。”
对于Rowe来说,问题是如何在高级数学上更好地使AI更好。
“帕特里克·沙夫托(Patrick Shafto),他是项目经理,他写了纸[PDF]在贝叶斯归纳上,这是您可以使用大型语言模型来弄清楚这一点的想法。” Rowe说。
“这不是我倾斜的方式,而是很多房间都倾斜的方式,因为如果您要使用现有技术,这是明显的下一步。
我认为我们需要的是数学推理
“对于房间里的人们来说,他们就像,'哦,你知道,去年的LLM越来越好。我们将继续前进。”这表明DARPA担心这是一个三年的计划。
“但是对于我自己来说,我认为我们需要的是数学推理。投标还没有加入,但这就是我们计划采取的方向。但是那里还有其他人也有不同的看法,例如做几何数学推理和类似的事情。可能有一些不同的方法来做到这一点。”
换句话说,Rowe不确定专注于自然语言是正确的道路。他建议基于视觉或音频输入的模型将更加精通高级数学。
Rowe问道:“我们选择在LLM上与贝叶斯的归纳有关,这似乎是您首先想到的,如果这是您的领域。”“或者,我们会使用更激进的几何建模和视觉上进行操作,而不是完全使用单词。
“而且它没有在房间里进行讨论,但是有些数学家在脑海中计算音频 - 他们认为数字是音乐音调。因此,如果我们对数学家实际上如何在现实生活中进行证明,人们可以提出很多野性的东西,因为大多数人都不知道常见的能力,因为这些方法并不需要,因为您对这些方法不了解。
也就是说,罗乐很乐观。“老实说,我认为我们要杀死它。我认为这不会花三年时间。但是我认为使用LLMS可能需要三年的时间。因此,问题就变成了,每个人都愿意成为多激动人心?”®