英语轻松读发新版了,欢迎下载、更新

高效的机器学习:用有限的数据预测材料特性

2024-12-30 15:02:30 英文原文

作者:Indian Institute of Science

Predicting material properties with limited data
MPT 模型背后的工作流程。在这种方法中,模型在初始训练阶段同时学习各种材料属性,然后对目标属性数据进行微调。该策略旨在利用丰富的多属性信息来增强对数据可能有限的目标属性的预测能力。图片来源:Reshma Devi

印度科学研究所 (IISc) 的研究人员与伦敦大学学院的合作者开发了基于机器学习的方法,即使在数据有限的情况下也能预测材料特性。这可以帮助发现具有所需特性的材料,例如半导体。

近年来,材料工程师转向机器学习模型来预测哪些类型的材料可以具有特定的属性,例如电子带隙、形成能和,以便设计新材料。然而,训练这些模型所需的材料特性数据有限,因为测试材料既昂贵又耗时。

这促使 IISc 材料工程系助理教授 Sai Gautam Gopalakrishnan 领导的研究人员致力于应对这一挑战。在一个新的学习,他们找到了一种有效的方法,使用称为迁移学习的机器学习方法来预测特定材料属性的值。

在迁移学习中,大型模型首先在大型数据集上进行预训练,然后进行微调以适应较小的目标数据集。“在这种方法中,模型首先学习执行一项简单的任务,例如将图像分类为猫和非猫,然后针对特定任务进行训练,例如将组织图像分类为包含肿瘤的组织图像和不包含肿瘤的组织图像用于癌症诊断,”Gopalakrishnan 解释道。

机器学习模型处理输入数据(例如图像)并生成输出,例如识别图像中存在的形状。模型的第一层接受原始图像输入。后续层从图像中提取特征,例如边缘,并逐渐细化。最后一层结合这些特征来识别和分类更高级别的特征,例如形状。

这些模型可以使用各种架构来构建,例如图神经网络(GNN),它可以处理图结构数据,例如任何材料的三维晶体结构。在 GNN 中,每层中的信息表示为节点(结构中的原子),节点之间的连接表示为边(原子之间的键)。在当前的研究中,研究团队开发了一个基于 GNN 的模型。

GNN 的架构(例如层数及其连接方式)决定了模型学习和识别数据中复杂特征的能力。该团队首先确定了模型所需的最佳架构以及预测材料属性所需的训练数据大小。第一作者兼博士 Reshma Devi 解释说,他们还通过仅调整某些层而“冻结”其他层来对模型进行预训练。材料工程系的学生。

对于这个经过优化和预先训练的模型,他们提供了有关材料特性的数据,例如和材料的形成能作为输入,因此该模型可以预测特定材料属性的值,例如压电系数。

该团队发现,他们的基于迁移学习的模型首先经过预训练,然后进行微调,其性能比从头开始训练的模型要好得多。他们还使用了一种称为多属性预训练 (MPT) 的框架,在该框架中,他们同时针对七种不同的块体 3D 材料属性对模型进行了预训练。值得注意的是,该模型还能够预测未经训练的 2D 材料的带隙值。

该团队现在正在使用该模型来预测离子在电池电极内移动的速度,这可能有助于构建更好的能量存储设备。

“它还可以通过预测半导体形成点缺陷的趋势来制造更好的半导体,这有助于印度推动半导体制造,”Gopalakrishnan 补充道。

更多信息:Reshma Devi 等人,用于准确材料属性预测的最佳预训练/微调策略,npj 计算材料(2024)。DOI:10.1038/s41524-024-01486-1

引文:高效的机器学习:用有限的数据预测材料特性(2024 年,12 月 30 日)检索日期:2024 年 12 月 30 日来自 https://techxplore.com/news/2024-12-efficient-machine-material-properties-limited.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。

关于《高效的机器学习:用有限的数据预测材料特性》的评论


暂无评论

发表评论

摘要

IISc 和伦敦大学学院的研究人员开发了一种机器学习方法,利用迁移学习来用有限的数据预测材料特性。他们使用图神经网络 (GNN) 和多属性预训练 (MPT) 框架,对七种大块 3D 材料属性进行预训练,然后针对特定任务进行微调,例如预测 2D 材料中的压电系数或带隙。这种方法明显优于从头开始训练的模型,并且可以帮助发现具有所需特性的新材料,例如半导体和更好的电池电极。