新的AI基础模型如何加速科学发现

2024-10-08 15:10:25 英文原文

就像有些食物更适合油炸,有些适合煮沸,有些则适合烘焙一样,不同的科学问题也适用于不同的AI技术。许多最近开发的AI模型是生成式的——它们根据自然语言请求生成答案和图像。但有些AI模型是模拟器,可以模拟某物的属性或行为。

然而,每个基础模型都是广泛的——材料模型不仅仅试图发现一种类型的材料,而是许多种;大气模型也不仅仅是为了预测降雨,还包括污染等其他现象。这种能够做多种事情的能力是定义一个AI模型为基础模型的关键。最终的目标是将多个模型链接在一起,创建更加广泛的基础模型,因为更广泛、更多样化的基础模型在其他领域已经超越了狭窄的模型。

新材料生成器 MatterGen

发现新材料可能看起来是一个狭窄的领域,但实际上它是研发的一个巨大焦点,因为材料种类繁多——合金、陶瓷、聚合物、复合材料、半导体等等,并且由于原子组合成新分子的可能性多达数十亿种新型材料对于减少碳排放的影响以及寻找安全的替代品以取代危害环境或健康的材料至关重要。

微软研究院的MatterGen基础模型“实际上可以直接生成满足你的设计条件的材料,”英国剑桥微软研究院的主要研究经理田颉说道。科学家不仅可以告诉MatterGen他们想要创造什么样的材料,还可以规定机械、电气、磁性和其他属性。

它给材料科学家提供了一种提出更好假设的方法,以设计他们想要的材料,谢说道。

A man dressed in blue sits on a yellow chair.
微软英国剑桥研究院首席研究员田解。乔纳森·班克斯摄于微软。

这种方法比过去的方法有所进步,因为AI在生成材料方面比筛选数百万种潜在组合来寻找符合科学家标准的那些组合要高效三到五个数量级。MatterGen从科学家的标准开始构建解决方案,而不是从所有可能的情况开始并一遍又一遍地筛选直到剩下少数几种与科学家标准相匹配的潜在组合。谢说,这种方法比通过反复试验在实验室中尝试创造新材料更加有效率和经济,尽管需要进行实验室工作来合成新的材料候选者。

MatterGen 是一个扩散模型,这是一种在图像创建工具中使用的 AI 架构。与生成图片不同,MatterGen 用于生成新材料的分子结构。几十年甚至几个世纪积累下来的实验数据对于训练基础模型来说远远不够丰富。但是由于物理学和化学等科学领域遵循一系列已确立的数学方程式,通过多次计算这些方程可以创建大量高质量的训练数据。团队使用量子力学中的密度泛函理论公式,在高性能计算机上运行以生成大约 60 万种结构来为 MatterGen 创建训练数据。

微软的MatterGen研究团队正在与合作伙伴合作,验证其生成的一些材料。未来的研究领域包括回收聚合物和创建可用于捕获碳的金属有机框架的方法。“到目前为止,我们主要关注无机材料,但将来,我们希望扩展到更复杂的材料。”谢说。

MatterSim 用于预测新材料的工作性能

即使有了人工智能的帮助,创建新材料也不是一个简单的过程。MatterSim 是 MatterGen 的辅助工具,用于模拟或预测新物质分子的行为。如果结果不符合科学家的期望,他们可以与 MatterGen 进行迭代循环,调整输入参数,就像微调微软 Copilot 提示一样,直到结果满足科学家的要求。然而,不同于 MatterGen,MatterSim 并不是生成式人工智能,而是一个仿真器,用于确定分子在不同温度和压力下的行为。

MatterSim使用了图神经网络变形器(Graphormer)这种架构基于转换器的基本理念,就像大型语言模型那样,将单词或句子分解开来以学习预测句子中的下一个词,但它是微软研究院为材料的行为和属性而创建的。“它被训练来掌握原子的语言,”上海微软研究院科学人工智能部门的主要研究员陆子恒说。“预测材料行为对化学家来说至关重要。更重要的是,该模型掌握了原子的语言——从整个元素周期表中学习。分子在嵌入空间中的样子是什么样的?如何将分子结构转换成机器可以理解的向量?这正是MatterSim除了其预测材料属性的能力之外最重要的事情。”

A male researcher in a blue shirt and jeans.
吕子恒,微软上海AI科学研究院首席研究员。图片由微软提供。

该模型使用主动学习,类似于学生为考试做准备的方式。当模型接收到新的数据时,它会判断自己是否对该数据不确定。如果是这样,那么这条数据会被纳入模拟中以重新训练模型,就像学生专注于他们尚未掌握的科目部分,而不是已经学过的部分。

关于分子行为的数据非常少,因此团队使用量子力学计算来创建合成数据,类似于MatterGen的例子。

卢说:“结果比以往的任何模型都要准确十倍,因为我们能够生成数据以覆盖前所未有的材料空间。”“这让模型非常准确。”

目前,MatterSim专注于无机材料,但以后可能会添加其他类型的材料。“MatterSim是一个特定领域的基础模型。科学人工智能的研究人员正朝着一个统一的大规模基础模型迈进,该模型能够理解整个科学语言,如分子、生物分子、DNA、材料、蛋白质——所有这些都可能在未来被统一起来,但在现阶段的MatterSim中,我们统一的是整个元素周期表。”卢说。

极光大气预测系统

计算机长期以来在天气预测中发挥了关键作用,通过计算物理或流体动力学方程中的数值来尝试模拟大气系统。“现在,AI和基础模型带来了全新的机会,这种机会与以往截然不同,”阿姆斯特丹微软研究院科学领域的AI研究主管Paris Perdikaris说。“让我们走出去观察世界并尽可能多地收集数据。然后训练一个AI系统来处理这些数据,从这些数据中提取模式,并帮助我们预测天气等。”

Two spinning orange globes on a black background depict changes in the Earth’s atmosphere, with the actual measurements on the left nearly matching the Aurora forecast on the right.
右边的地球显示的是Aurora的天气预测,而左边的地球显示的是实际测量到的条件。动画由Microsoft提供。

AI的一个巨大优势是,一旦训练完成,它不需要强大的计算能力。Perdikaris表示,目前使用全天候运行的超级计算机生成为期10天的天气预报大约需要两个小时。而微软的大气基础模型Aurora则可以在几秒钟内完成同样的工作,使用的是一台配备GPU卡的桌面电脑。“AI方法带来的主要区别是计算效率和降低获得这些预测的成本。”他表示。

Aurora还通过使用基于物理的模型数据以及来自卫星、气象站和其他来源的真实世界数据来提高准确性,“这些数据更真实地反映了现实,”他说。“因为它暴露在所有这些不同的信息源中,Aurora有机会将它们融合在一起,并产生比我们现有的传统模拟工具更为准确的预测。”

Aurora是一个大型神经网络,一个视觉变压器,在大约1.2拍字节的数据上进行了训练——相当于互联网上所有文本总量的十倍左右。“这仍然是描述地球系统的数据中微不足道的一部分,”Perdikaris说。

A male researcher in a blue suit smiles.
巴黎佩尔迪卡里斯,微软研究人工智能科学部门的首席研究员经理(阿姆斯特丹)。图片由微软提供。

三个典型的天气问题——未来十分钟这里是否会下雨?接下来十天全球的天气会怎样?几个月或几年后的天气将会如何?——迄今为止都是通过不同的预测模型来处理的。Aurora及其未来的扩展将能够使用同一个模型回答所有这些问题。

Aurora 是基于天气数据训练的,但是通过使用大气化学数据对其进行微调,该模型也可以预测污染水平。

我们的初始假设之一是,我们可以利用模型从天气中学习到的知识,并尝试将其适应受不同物理定律支配的新任务,如大气化学,然后看看它的表现。”Perdikaris说。“令我们惊讶的是,这种方法行之有效,并且给出了一些很有前景的初步结果。”

AI在污染预测中的优势更加明显,因为污染预测的成本是天气预测的十倍。

使科学发现更易于获取

吕指出,这些模型可以使科学对学生更具吸引力。在他攻读学位时,他必须手写方程式,“但现在有了这些模拟,我们实际上可以用计算机或笔记本电脑进行统计计算。你可以在屏幕上实时看到反应、分子和材料的行为。这给你一个非常好的感受实际发生了什么,而不仅仅是纸上谈兵看方程式。”

微软的科学基础模型都是在Azure上从头开始构建的。该公司计划尽早向公众提供这些模型的早期版本,以帮助促进科学发现的民主化并获取社区反馈。Kruft表示,这些反馈将有助于识别实际应用案例,并为未来模型迭代的信息和形态塑造提供依据。

基础模型有能力改变日常生活并革新产业。通过加速科学发现,它们不仅有望在医学和材料等领域推动快速进步,而且还为原子、分子和蛋白质等复杂系统提供更深入的见解,Kruft说,并补充道,这反过来又在各个行业中开启了巨大的商业可能性。

相关链接:

了解更多:微软研究院AI for Science

阅读更多:材料生成:属性引导的材料设计

阅读更多:MatterSim:一种用于真实世界条件下材料的深度学习模型

阅读更多:介绍 Aurora:首个大规模大气基础模型

顶部图片:AI基础模型MatterGen和MatterSim有助于创建新材料并模拟它们的性能。照片由Jonathan Banks为Microsoft拍摄。

关于《新的AI基础模型如何加速科学发现》
暂无评论

摘要

就像有些食物适合油炸,有些适合煮沸,还有些适合烘烤一样,不同的科学问题也适用于不同的AI技术。微软研究院的MatterGen基础模型“实际上可以直接生成符合设计条件的材料”,英国剑桥的微软研究院首席研究经理Tian Xie说。科学家不仅可以告诉MatterGen他们想要创造哪种材料,还可以规定机械、电气、磁性等属性。现在,人工智能和基础模型带来了这一全新的机会,这是根本不同的,”阿姆斯特丹微软研究院科学AI部门的首席研究经理Paris Perdikaris说。“接下来10天内的全球天气会是什么样子?”“我们的初步假设之一是,我们可以利用该模型从天气中学习的知识,并尝试将其适应于由不同物理定律支配的新任务,例如大气化学,然后看看它的表现如何,”Perdikaris说。