作者:by Sanjukta Mondal, Phys.org
深度学习模型在预测和工程功能酶和蛋白质方面表现出了巨大的潜力。这种能力也扩展到其他生物学领域吗?
与期望相反,最近的一项研究发现,基于深度学习的基础模型在预测基因表达或功能的遗传扰动改变如何影响转录组的基因表达图(细胞的基因表达谱)方面并不能胜过简单的基线方法。在双扰动的情况下,两个基因同时改变了,预测错误与基线添加剂模型相比,在深度学习模型中的模型更高,该模型并没有使用复杂的机器学习,而只是添加了基因变化的组合效应。
基础模型是经过大量数据训练的深度学习模型。在这种情况下,他们是指对最近发表的转录组学培训的单细胞模型,涵盖了数百万个单元。
出版在自然,这项研究利用了公开可用的单细胞CRISPR扰动数据集,以基于五个著名的基础模型和其他两个深度学习模型,针对四个故意简单的基线。
基于深度学习的基础模型的最新研究旨在通过对大量数据进行培训来彻底改变对生物学的理解,并希望这些模型能够对细胞的工作方式有一般的了解,而不仅仅是记住特定的实验结果。这种能力将允许预测结果而无需执行实验,从而显着加速药物发现和疾病研究。
然而,生物学是一门非常复杂的科学,其中细胞,基因和生物的行为取决于许多因素,其中许多因素仍然未被发现。为了理解这些复杂性而开发的模型在计算上非常昂贵,因为它们需要时间,能量和功能强大的机器。在将进一步的资源投入到建立此类模型中之前,要暂停并问:它们是否真的有效,并且它们表现优于我们已经拥有的模型吗?
尽管以前的研究进行了基准实验,但其中大多数与另一个深度学习模型相吻合,并且与简单模型缺乏比较。这项研究的研究人员通过将简单的,可解释的基线模型与复杂的基线模型进行比较来改变这一点。
他们发现,在预测单个或双重扰动对单个或双重扰动对基于平均模型的预测等简单基线(例如不变,均值或线性模型的预测)中,没有一个复杂的模型始终如一地胜过简单的基线。基因表达。大多数模型还努力准确预测复杂的遗传相互作用。
这些发现很明显,与简单,资源较低的方法相比,更高的成本和复杂性不一定会转化为更好的性能。它还确定了对现有模型进行严格测试和基准测试的重要性。
研究人员得出的结论是,基础模型的雄心勃勃的目标是学习对细胞状态并基于这些知识预测结果的普遍理解的雄心勃勃的目标仍然是遥不可及的。
我们作者为您写的Sanjukta Mondal,编辑加比·克拉克(Gaby Clark)并对事实进行了检查和审查罗伯特·埃根(Robert Egan)本文是仔细人类工作的结果。我们依靠像您这样的读者来使独立科学新闻业保持活力。如果此报告对您很重要,请考虑捐款(尤其是每月)。你会得到一个无广告表示感谢。
更多信息:君士坦丁·艾尔曼·埃尔特兹(Constantin Ahlmann-telte)等,基于深度学习的基因扰动效应预测尚未超过简单的线性基准,,自然方法(2025)。doi:10.1038/s41592-025-02772-6
©2025科学X网络
引用:研究发现,复杂的深度学习模型在理解遗传扰动方面没有更好的理解遗传扰动(2025年8月15日)检索2025年8月15日摘自https://phys.org/news/2025-08-Complex-deep-deep-genetic-perterbation-simple.html
该文档具有版权。除了为私人研究或研究目的的任何公平交易外,没有未经书面许可,可以复制部分。内容仅用于信息目的。