英语轻松读发新版了,欢迎下载、更新

计算化学方法可以从电子结构计算中获取更多信息

2025-01-14 21:29:06 英文原文

作者:by Steve Nadis, Massachusetts Institute of Technology

New computational chemistry techniques accelerate the prediction of molecules and materials
开发了一种多任务机器学习方法来预测分子的电子特性,如此处所示的计算工作流程所示。图片来源:麻省理工学院

回到过去——真正的过去——设计材料的任务是艰巨的。在 1000 多年的时间里,研究人员试图通过将铅、汞和硫等物质按照他们希望的正确比例混合来制造黄金。甚至像第谷·布拉赫、罗伯特·博伊尔和艾萨克·牛顿这样的著名科学家也尝试过我们称之为炼金术的徒劳尝试。

当然,材料科学已经取得了长足的进步。在过去的 150 年里,研究人员一直受益于元素周期表,该表告诉他们不同的元素具有不同的属性,并且一种元素不能神奇地转化为另一种元素。此外,在过去十年左右的时间里,机器学习工具极大地提高了我们确定各种物质的结构和物理性质的能力。和物质。

由麻省理工学院东京电力公司核工程教授、麻省理工学院教授 Ju Li 领导的团队进行的新研究和工程——有望在促进材料设计的能力方面实现重大飞跃。他们的调查结果出现自然计算科学

目前,大多数用于表征分子系统的机器学习模型都基于密度泛函理论 (DFT),该理论提供了一种量子力学方法,通过观察电子密度分布来确定分子或晶体的总能量。基本上是位于分子附近空间中每个给定点周围单位体积内的电子的平均数量。(沃尔特·科恩 (Walter Kohn) 60 年前共同发明了这一理论,并因此于 1998 年获得诺贝尔化学奖。)

虽然这种方法非常成功,但它也有一些缺点,李说:“首先,准确性并不是很高。其次,它只告诉你一件事:分子系统的最低总能量。”

“夫妻疗法”来拯救

他的团队现在依赖于一种不同的计算化学技术,该技术也源自量子力学,称为耦合簇理论或 CCSD(T)。

“这是量子化学的黄金标准,”李评论道。

CCSD(T) 计算的结果比 DFT 计算的结果准确得多,并且与目前通过实验获得的结果一样值得信赖。问题在于,在计算机上执行这些计算非常慢,他说,“而且缩放比例很差:如果将系统中的电子数量增加一倍,计算成本就会增加 100 倍。”

因此,CCSD(T) 计算通常仅限于具有少量原子的分子(大约 10 个原子)。超出这个数量级的任何东西都会花费太长时间。

这就是机器学习的用武之地。CCSD(T) 计算首先在传统计算机上执行,然后将结果用于训练具有李和他的同事专门设计的新颖架构的神经网络。训练后,神经网络可以利用近似技术更快地执行这些相同的计算。更重要的是,他们的神经网络模型可以提取更多有关分子的信息,而不仅仅是其能量。

“在之前的工作中,人们使用了多种不同的模型来评估不同的特性,”麻省理工学院博士唐浩说。材料科学与工程专业的学生。“在这里,我们仅使用一个模型来评估所有这些属性,这就是为什么我们将其称为‘多任务’方法。”

“多任务电子哈密顿网络”(MEHnet)揭示了许多电子特性,例如偶极矩和四极矩、电子极化率和光学激发间隙(从电子中获取电子所需的能量)基态到最低激发态。

“激发间隙影响材料的光学特性,”唐解释道,“因为它决定了分子可以吸收的光的频率。

他们的 CCSD 训练模型的另一个优点是它不仅可以揭示基态的特性,还可以揭示激发态的特性。该模型还可以预测与其振动特性相关的分子的红外吸收光谱,其中分子内原子的振动相互耦合,从而导致各种集体行为。

他们的方法的优势很大程度上归功于网络架构。借鉴麻省理工学院助理教授 Tess Smidt 的工作成果,该团队正在利用所谓的 E(3) 等变图”,唐说,“其中节点代表原子,连接节点的边代表原子之间的键。我们还使用定制算法,将物理原理(与人们如何计算量子力学中的分子特性相关)直接融入到我们的计算中。模型。”

测试, 1, 2 3

当对已知碳氢化合物分子进行分析时,该模型的性能优于 DFT 模型,并且与已发表文献中的实验结果非常匹配。

北卡罗来纳大学夏洛特分校的材料发现专家朱强(未参与这项研究)对迄今为止所取得的成就印象深刻。

“他们的方法能够利用小数据集进行有效训练,同时与现有模型相比,实现更高的准确性和计算效率,”他说。“这是一项令人兴奋的工作,它说明了计算化学和,为开发更准确和可扩展的电子结构方法提供了新的想法。”

这个位于麻省理工学院的研究小组首先将他们的模型应用于可以制造有机化合物的小型非金属元素——氢、碳、氮、氧和氟——此后开始研究更重的元素:硅、磷、硫、氯,甚至铂。在对小分子进行训练后,该模型可以推广到越来越大的分子。

“以前,大多数计算仅限于使用 DFT 分析数百个原子,而使用 CCSD(T) 计算仅分析数十个原子,”Li 说。“现在我们正在讨论处理数千个原子,最终可能是数万个原子。”

目前,研究人员仍在评估已知分子,但该模型可用于表征以前从未见过的分子,以及预测由不同种类分子组成的假设材料的特性。唐说:“我们的想法是使用我们的理论工具来挑选出满足一组特定标准的有前途的候选者,然后将它们推荐给实验人员进行检查。”

一切都与应用程序有关

展望未来,朱对可能的应用持乐观态度。“这种方法具有高通量分子筛选的潜力,”他说。“在这项任务中,实现化学准确性对于识别具有所需特性的新型分子和材料至关重要。”

李说,一旦他们展示出分析可能包含数万个原子的大分子的能力,“我们应该能够发明新的聚合物或材料”,这些聚合物或材料可能用于药物设计或半导体设备。对较重过渡金属元素的研究可能会导致新电池材料的出现——目前这是一个迫切需要的领域。

在李看来,未来是广阔的。

“这不再只是一个领域的问题,”他说。“我们的最终目标是以 CCSD(T) 级的精度覆盖整个元素周期表,但计算成本比 DFT 更低。这将使我们能够解决化学、生物学和材料科学领域的广泛问题。目前很难知道这个范围到底有多大。”

更多信息:唐浩等人,通过多任务学习接近分子电子结构的耦合簇精度,自然计算科学(2024)。DOI:10.1038/s43588-024-00747-9

这个故事由麻省理工学院新闻转载(web.mit.edu/新闻办公室/),一个热门网站,涵盖有关麻省理工学院研究、创新和教学的新闻。

引文:计算化学方法可以从电子结构计算中获取更多信息 (2025年1月14日)检索日期:2025 年 1 月 15 日来自 https://phys.org/news/2025-01-chemistry-method-Electronic.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。

关于《计算化学方法可以从电子结构计算中获取更多信息》的评论


暂无评论

发表评论

摘要

我们开发了一种多任务机器学习方法,可以高精度预测分子的电子特性,超越传统的密度泛函理论(DFT)方法并接近耦合簇理论(CCSD(T))的精度。该方法使用名为 MEHnet 的神经网络,它可以更有效地处理更大的分子系统,并提供对各种电子特性的全面见解。麻省理工学院的研究人员在小分子上训练了这个模型,现在正将其应用于较重元素,旨在以降低计算成本的方式广泛覆盖元素周期表。