作者:Sam Lemonick, special to C&EN
信用:Shutterstock
密度功能理论是一种广泛使用的基于计算机的量子力学方法,用于计算原子,分子和材料的性质。
当实验不切实际时,密度功能理论(DFT)计算可以使研究人员准确地近似化学性能。支撑计算的数学方程是按照它们所应用的分子和材料仔细量身定制的。但是,每个方程式都有在计算时间的准确性和需求之间的权衡。
微软研究人员认为,他们找到了一种使用机器学习的方法为小分子推动这些极限(Arxiv 2025,doi:10.48550/arxiv.2506.14665)。预印本出版物尚未进行同行评审。
DFT基于分子的电子密度,理论上可用于确切确定特性。实际上,不可能计算许多电子之间的微妙相互作用。相反,计算化学家提出了交换相关(XC)函数的不同近似值,这是捕获这些相互作用的DFT方程中的术语。
作为使用这些手工制作的功能的一种替代方法,Microsoft的Paola Gori-Giorgi,Jan Hermann,Rianne van den Berg和同事建立了一个深度学习模型,该模型从它们创建的数据库中推断出了XC功能,它们使用了约150,000个具有五个或更少非碳碳的分子的反应能量。
他们不是第一个将机器学习应用于提出理想XC功能的挑战的组。但是,Microsoft团队使用的算法比其他算法更复杂,并结合了从大型语言模型中借来的最新工具。他们的培训数据大约比其他人使用的数据集大约两个数量级。
该小组将功能性的Skala称为梯子。这是对日益复杂的数学范围的敬意,计算科学家添加了其模型以达到更高的准确性,有时称为雅各布的梯子方法。
研究人员报告说,他们在计算小分子能量中的功能性预测误差是B97m-V的一半,这被认为是当今可用的更好功能之一。它是在包装中间的,用于涉及金属原子的计算,Skala XC没有受过训练。他们说,与其他功能相比,在相同或更少的计算机时间内计算分子特性。
计算科学家没有测试过Skala时MariviFernândez-Serra斯托尼·布鲁克大学(Stony Brook University)说,我的印象是,这将是一个非常好的功能。她和其他人还说,该小组的优势是微软拥有巨大的资源来生成其培训数据。
对于其他DFT研究人员来说,Skala的优势不太清楚。对于从事金属工作的人来说,这将不会工作。”A.J.梅德福是佐治亚理工学院的化学工程师,他将机器学习用于DFT。适合金属和固体效果很好的功能在材料科学中特别有价值,因为它们可以加速化学空间的探索。
梅德福对Microsoft团队将能够为具有更多电子的原子生成类似的高质量培训数据。他说,在现有功能足够好时,在小分子上使用DFT的研究人员可能不需要新功能。
Skala XC团队高级研究经理Gori-Giorgi不同意。她说,与外部专家合作,她的小组已经确定了他们认为该团队可以用来扩展其培训数据库以包括较大原子的计算技术。
该领域的另一位研究人员,Ryo Nagai在给C&EN的一封电子邮件中说,他对Skala XC能够学习的方式印象深刻,这将有助于发展研究。但是像梅德福一样,他对金属和固体的表现也持怀疑态度。他质疑了Skala表现的小组测试,并说他想看到这对更复杂的计算挑战。
Microsoft的努力在Google Deepmind上发动了一些企业,释放机器学习功能((科学2021,doi:10.1126/science.abj6511)张贴大量的大张旗鼓((科学2021,doi:10.1126/science.ABM2445)。但这最终被证明太密集了,无法有用。
领导2021年研究的Deepmind的James Kirkpatrick不会对Microsoft的努力发表评论,但在一封电子邮件中告诉C&EN,该公司正在采用相关方法。
化学与工程新闻
ISSN 0009-2347
版权所有©2025美国化学学会