材料创新是重大技术突破的关键驱动力之一。20 世纪 80 年代钴酸锂的发现为当今的锂离子电池技术奠定了基础。它现在为现代手机和电动汽车提供动力,影响着数十亿人的日常生活。设计更高效的太阳能电池、用于电网级储能的更便宜的电池以及从大气中回收二氧化碳的吸附剂也需要材料创新。
为目标应用寻找新材料就像大海捞针一样。从历史上看,这项任务是通过昂贵且耗时的实验试错来完成的。最近,大型材料数据库的计算筛选使研究人员能够加快这一过程。尽管如此,找到具有所需特性的少数材料仍然需要筛选数百万候选材料。
今天,在一个论文发表于自然(在新选项卡中打开),我们分享 MatterGen,这是一种生成式人工智能工具,可以从不同的角度解决材料发现问题。它不是筛选候选人,而是根据应用程序的设计要求提示直接生成新颖的材料。它可以生成具有所需化学、机械、电子或磁性特性以及不同约束组合的材料。MatterGen 实现了生成式 AI 辅助材料设计的新范例,可以有效地探索材料,超越有限的已知材料。
一种新颖的扩散架构
MatterGen 是一种在材料 3D 几何结构上运行的扩散模型。就像图像扩散模型通过修改噪声图像中的像素颜色来根据文本提示生成图片一样,MatterGen 通过调整随机结构的位置、元素和周期晶格来生成建议的结构。扩散架构专为处理周期性和 3D 几何等特殊特性的材料而设计。
它接受了来自 608,000 个稳定材料的训练材料项目(在新选项卡中打开)(议员)和亚历山大港(在新选项卡中打开)(亚历克斯)数据库。性能的提高可以归因于架构的进步,以及我们训练数据的质量和大小。
MatterGen 可以使用标记的数据集进行微调,以在任何所需条件下生成新颖的材料。我们展示了在给定目标化学和对称性以及电子、磁性和机械性能约束的情况下生成新型材料的示例(图 2)。一个
优于筛选
MatterGen 相对于筛选的主要优势是它能够访问未知材料的全部空间。在图 4 中,我们表明 MatterGen 继续生成更多新颖的候选材料,例如,其体积模量高于 400 GPa,难以压缩。相比之下,由于已知的候选者筋疲力尽,筛选基线饱和。
处理成分紊乱
成分无序(图 5)是一种常见现象,其中不同原子可以在合成材料中随机交换其晶体位置。最近(在新选项卡中打开),社区一直在探索在计算设计材料的背景下材料的新颖性意味着什么,因为广泛使用的算法不会区分结构对,其中唯一的区别是各自位点中相似元素的排列。
我们通过引入一种考虑组合无序的新结构匹配算法,为该问题提供了初步解决方案。该算法评估一对结构是否可以被识别为同一底层组成无序结构的有序近似。这提供了新颖性和独特性的新定义,我们在计算评估指标中采用了该定义。我们也让我们的算法公开(在新选项卡中打开)作为我们评估包的一部分。
实验实验室验证
与李文杰教授领导的团队合作深圳先进技术研究院(在新选项卡中打开)中国科学院SIAT(中国科学院SIAT),我们合成了一种新型材料TaCr2O6,其结构是在200 GPa的体积模量值上调节模型后由MatterGen生成的。合成材料的结构与 MatterGen 提出的结构一致,但需要注意 Ta 和 Cr 之间的成分无序。此外,我们通过实验测量了 169 GPa 的体积模量,与设计规范给出的 200 GPa 相比,相对误差低于 20%,从实验角度来看非常接近。如果类似的结果可以转化到其他领域,将对电池、燃料电池等的设计产生深远的影响。一个
AI模拟器和发电机飞轮
MatterGen 为 AI 加速材料设计提供了新机会,补充了我们的 AI 模拟器物质模拟。MatterSim 遵循第五范式科学发现,显着加快材料特性模拟的速度。MatterGen 反过来又通过属性引导生成加快了探索新候选材料的速度。MatterGen 和 MatterSim 可以协同工作作为飞轮来加速新型材料的模拟和探索。
使 MatterGen 可用
我们相信对材料设计产生影响的最佳方式是将我们的模型向公众开放。我们发布了MatterGen 的源代码(在新选项卡中打开)根据麻省理工学院的许可,以及训练和微调数据。我们欢迎社区使用我们的模型并在其基础上进行构建。
展望未来
MatterGen 代表了生成式人工智能技术实现的材料设计新范式。与基于筛选的方法相比,它探索了更大的材料空间。通过提示引导材料探索也更加高效。类似于生成式人工智能如何影响药物发现(在新选项卡中打开),它将对我们如何设计电池、磁铁和燃料电池等广泛领域的材料产生深远的影响。
我们计划继续与外部合作者合作,进一步开发和验证该技术。– 在约翰霍普金斯大学应用物理实验室 (APL),我们致力于探索有潜力推动新型任务材料发现的工具。这就是为什么我们有兴趣了解 MatterGen 对材料发现可能产生的影响,”领导 APL 多项材料发现工作的计算材料科学家 Christopher Stiles 说道。
致谢
这项工作是高度协作的团队努力的结果微软科学人工智能研究院。完整作者包括:克劳迪奥·泽尼,罗伯特·平斯勒,丹尼尔·祖格纳,安德鲁·福勒,马修·霍顿、 付祥、王子龙, Aliaksandra Shysheya, Jonathan Crabbé,上田翔子, 罗伯托·索尔迪略,孙立新,杰克·史密斯,阮碧莲,汉内斯·舒尔茨,莎拉·刘易斯,黄金伟,子恒路, 周一池,韩阳,郝红霞,李洁兰, 杨春雷, 李文杰,富冈良太,谢天. . . . . . . . . . . . . . .