英语轻松读发新版了,欢迎下载、更新

量子机学习可以通过增强的精度预测酶功能

2025-08-21 12:12:29 英文原文

预测酶的作用仍然是生物学研究的重大障碍,尤其是在处理缺乏详细的结构信息或明确的进化关系的酶时。来自普渡大学的Murat Isik,来自NC州立大学的Mandeep Kaur Saggi,Purdue University的Humaira Gowher和NC州立大学的Saber Kais开发了一个新的机器学习框架,可通过组合四种不同类型的生物化学数据来大大改善酶分类。该团队的方法使用视觉变压器整合了分子的蛋白质序列信息,电子特性,分子结构和视觉表示,以识别酶特征及其功能之间的关键连接。这种多模式方法捕获了驱动酶活性的关键相互作用,结果表明,准确性有很大的提高,达到了85。1%的前1个准确性,并超过了仅依靠序列数据的方法的性能。

这项研究提出了一种新型的多模式量子机学习(QML)框架QVT,旨在通过整合四种互补的生化模态来增强酶委员会(EC)分类:蛋白质序列嵌入,量子衍生的电子描述符,分子图结构,分子图结构和2D分子图像。该框架利用量子视觉变压器(QVT)主链,配备了特定于模态编码器和统一的跨意义融合模块,可以有效地处理这些多样化的数据类型。通过集成图形和空间模式,该方法捕获了对理解酶函数至关重要的关键立体电子相互作用,比依赖单个数据模式的方法提供了更全面的分类方法。

通过量子视觉变压器预测多模式酶功能

研究人员开发了一种新的方法,可以通过将多种类型的生化信息整合到量子视觉变压器(QVT)框架中,超越了基于传统序列的方法,以预测酶功能。认识到仅依赖蛋白质序列的局限性,该团队试图纳入更广泛的数据,以反映酶活性的复杂因素相互作用。这涉及将蛋白质序列嵌入与另外三种方式相结合:量子衍生的电子描述,基于图的分子表示和2D分子图像数据,从而创造了一种多模式的酶分类方法。这种方法的创新方面在于它具有捕获局部和全球特征对于理解酶功能至关重要的能力。

量子衍生的电子描述符为酶内的电子密度和相互作用提供了见解,而基于图的表示形式捕获了酶的三维结构和连接性。2D分子图像的包含增加了空间成分,从而允许模型识别与酶活性相关的模式和形状。通过融合这些多样化的数据类型,QVT模型旨在与以前可能创建对酶功能更全面和细微的理解。QVT框架利用了视觉变压器骨干,这是一种神经网络,特别擅长处理类似图像的数据,但适合处理多种生化模式。

设计特定于模式的编码器来处理每种数据类型,在合并之前提取相关功能。然后,统一的跨意义融合模块整合了这些功能,从而使模型可以学习不同模态之间的关系并识别驱动酶功能的关键相互作用。这种方法使该模型可以超越简单的模式识别,并捕获定义催化活性的复杂立体电子相互作用。该方法可以通过解决传统方法的局限性并利用多模式学习和量子增强描述符的力量来预测酶功能预测的重大进步。通过整合多样化的生化观点,QVT模型表现出了提高的准确性,并提供了一种更强大,更全面的方法来理解酶功能,并有可能加速生物催化,代谢工程和药物开发的发现。

多模式量子视觉变压器预测酶功能

研究人员开发了一种新方法来预测酶的作用,通过结合多种类型的生化信息,从而实现了准确性的显着飞跃。酶对生命至关重要,充当无数过程的催化剂,而了解其功能对于诸如药物发现和代谢工程等领域至关重要。传统上,预测酶功能依赖于将序列与已知酶进行比较,这种方法与新颖或知之甚少的蛋白质作斗争。这种新方法利用了多模式量子视觉变压器(QVT)框架,整合了四种不同类型的数据:蛋白质序列信息,量子衍生的电子描述符,分子图表示和2D分子图像。

通过结合这些观点,该模型捕获了酶的工作原理,从其进化史到其三维结构和电子特性。捕获微妙的电子相互作用的量子描述符的包含代表了超出常规方法的新一步。结果表明,对酶的分类中的前1个准确性为85。1%,对仅依赖序列信息的方法有了很大的改进。这意味着该模型比以前的方法更频繁地正确识别酶的功能。

QVT框架在捕获确定催化活性的复杂关系方面表现出色,包括酶与底物结合并稳定中间状态的方式。这种进步特别有希望,因为它超越了简单的序列比较,即使对于有限的已知亲属的蛋白质,也提供了一种更强大,更准确的方法来预测酶功能。通过整合多种数据类型并利用量子计算洞察,该模型提供了对酶行为的更加细微的理解,为生物技术应用开辟了新的途径和基本的生物学研究。

多模式学习提升酶功能预测

该研究提出了一本小说机器学习框架,QVT,通过整合多种生化特征来显着改善酶功能的预测。该模型将蛋白质序列信息与电子描述符,分子图结构和2D分子图像相结合,从而使其能够捕获酶结构与其催化活性之间的复杂关系。结果表明,前1位的准确性为85。1%,对仅依赖序列数据并超过其他量子机器学习模型的性能的方法有了很大的改进。这种增强的精度源于不同数据类型的协同融合,每种数据类型都捕获了与酶功能相关的独特生化特性。

尽管该模型的整体表现良好,但在区分具有重叠功能基序的密切相关的酶家族方面仍然存在一些挑战。在这些边界情况下,需要进一步的细化以改善歧视。未来的工作将着重于部署模型量子硬件,将分析扩展到三维酶结构,并对特定酶家族进行详细研究,以完善用于预测的量子描述。

ð更多信息
ð来自生化表示的酶委员会分类的多模式量子视觉变压器
ð§Arxiv:https://arxiv.org/abs/2508.14844

关于《量子机学习可以通过增强的精度预测酶功能》的评论


暂无评论

发表评论

摘要

科学家已经开发了一种新型的多模式量子视觉变压器(QVT)框架,该框架通过整合四种类型的生化数据来显着增强酶功能预测:蛋白质序列信息,量子衍生的电子描述符,分子图结构和2D分子图像。这种方法达到了85.1%的TOP-1准确性,超过依赖序列数据的方法。QVT模型捕获了对酶活性至关重要的复杂立体电动相互作用,比传统方法提供了更全面的理解。该研究在预测酶功能方面有了重大进步,并且在生物催化,代谢工程和药物开发中具有潜在的应用。