作者:by Northwestern University
但是,可能的基因组合数量很大,这使得研究人员难以确定引起的特定基因组合非常困难
疾病。使用生成人工智能(AI)模型,新方法放大有限基因表达
数据,使研究人员能够解决引起复杂特征的基因活性模式。这些信息可能导致新的,更有效的疾病治疗,涉及与多个基因相关的分子靶标。这项研究,“因果基因集的生成预测,负责复杂性状,”
出版在国家科学院论文集。该研究的高级作者西北的阿迪尔森·莫特(Adilson Motter)说:“许多疾病是由基因的结合决定的。”
“您可以将诸如癌症之类的疾病与飞机崩溃进行比较。在大多数情况下,飞机崩溃需要发生多种故障,并且不同的失败组合可能会导致相似的结果。这使确定原因的任务变得复杂。我们的模型通过识别主要参与者及其集体影响来帮助简化事物。”
专家
复杂系统,Motter是西北温伯格艺术与科学学院的Charles E.和Emma H. Morrison物理学教授,也是网络动态中心主任。该研究的其他作者与Motter的实验室有关,包括博士后研究员Benjamin Kuznets-Speck,研究生Buduka Ogonor和研究助理Thomas Wytock。
几十年来,研究人员一直在努力揭开复杂人类特征和疾病的遗传基础。即使是高度,智力和头发颜色等非疾病特征,也取决于基因的集合。
现有方法,例如全基因组关联研究,尝试找到与性状相关的单个基因。但是他们缺乏检测基因组的集体影响的统计能力。
莫特说:“人类基因组项目向我们表明,我们的基因只有单细胞细菌的六倍。”
“但是人类比细菌要复杂得多,仅基因的数量并不能解释这一点。这突出了多基因关系的普遍性,并且必须是基因之间的相互作用,从而带来复杂的生命。”
Wytock补充说:“识别单个基因仍然很有价值。”“但是只有很小的可观察性状或表型可以通过单个基因的变化来解释。相反,我们知道表型是许多基因一起工作的结果。因此,有意义的是,多个基因通常有助于特征的变异。”
帮助弥合长期存在的知识差距基因构成(基因型)和可观察的特征(表型),研究团队开发了一种复杂的方法,将机器学习与优化相结合。
该模型称为整个转录组的条件变异自动编码器(TWAVE),该模型利用生成AI来识别人类中有限基因表达数据的模式。因此,它可以模仿患病和健康的状态,以便可以将基因表达的变化与表型的变化相匹配。
该模型没有孤立地检查单个基因的影响,而是确定了集体导致复杂性状出现的基因组。然后,该方法使用优化框架来查明特定的基因变化,这些基因变化最有可能将细胞状态从健康转变为患病,反之亦然。
威托克说:“我们不是在研究基因序列,而是基因表达。”“我们对临床试验的数据培训了模型,因此我们知道哪些表达曲线是健康或患病的。对于较小的基因,我们也有实验数据这说明了当基因打开或关闭基因时网络的反应,我们可以与表达数据相匹配,以找到与疾病有关的基因。”
专注于基因表达具有多个好处。首先,它绕过患者隐私问题。遗传数据一个人的实际DNA序列本质上是个人独有的,它提供了健康的健康,遗传倾向和家庭关系的高度个人蓝图。
另一方面,表达数据更像是细胞活性的动态快照。第二,基因表达数据隐含地说明环境因素,可以将基因“向上”或“向下”转动以执行各种功能。
莫特说:“环境因素可能不会影响DNA,但肯定会影响基因表达。”“因此,我们的模型可以间接考虑环境因素的好处。”
为了证明TWAVE的有效性,该团队对几种复杂疾病进行了测试。该方法成功地识别了一些基因,而这些基因被引起这些疾病的现有方法所遗漏。
TWAVE还透露,不同人群不同的基因可能引起相同的复杂疾病。这一发现表明,个性化治疗方法可以量身定制为患者的特定疾病遗传驱动因素。
莫特说:“疾病在两个不同的人中也可以表现出类似的表现。”“但是,原则上,由于遗传,环境和生活方式差异,每个人可能涉及不同的基因。这些信息可能会定向个性化治疗。”
更多信息:Motter,Adilson E.,因果基因集的生成预测,负责复杂性状,国家科学院论文集(2025)。doi:10.1073/pnas.2415071122。doi.org/10.1073/pnas.2415071122引用
:AI识别引起复杂疾病的关键基因集(2025年,6月9日)检索2025年6月10日摘自https://medicalxpress.com/news/2025-06-ai-key-gene-complex-diseases.html
该文档具有版权。除了为私人研究或研究目的的任何公平交易外,没有未经书面许可,可以复制部分。内容仅用于信息目的。