英语轻松读发新版了,欢迎下载、更新

通过多模式AI解锁丰富的遗传见解

2025-06-23 21:14:58 英文原文

从具有尖端技术的医学专家到简单的智能手表的所有事物都以前所未有的规模生成数据。电子健康记录,医学成像,诊断测试,基因组数据,甚至来自智能手表的实时测量的聚合为研究人员和临床医生提供了大量数据。这些多样化的数据流通常具有独特的和重叠的信号,即使在同一器官系统中也是如此。

例如,在心血管系统中心电图(ECG)测量心脏的电活动,而光解释图(PPG)常见智能手表跟踪血量变​​化。这些方式的共分析可以同时评估心脏的电气系统及其泵送效率,从而提供更完整的心脏健康状况。将这些生理特征与来自大型民族水平生物库的遗传信息相结合,可以鉴定出疾病的遗传基础。

我们的早期工作,登记,对于使用健康数据的遗传发现成功,但它是为单一数据类型(即单峰设置)设计的。或者,分别分析每种方式,然后尝试将发现拼凑在一起(我们称之为u-regle或单峰式)也可能不是最有效的方法。U-Regle可能会错过不同方式之间的细微共享信息。相反,我们假设共同对这些互补数据流进行建模将增强重要的生物学信号,减少噪声并导致更强大的遗传发现。

在这里,我们介绍了我们最近的论文利用多模式AI改善心血管特征的遗传分析我们在美国人类遗传学杂志。我们开发了一种称为M-Regle的regle的多模式版本,该版本允许一次分析多种类型的临床数据。M-雷格会产生较低的重建误差,确定更多的遗传关联,并且与其前身U-Regle相比,预测心脏疾病的风险评分优于预测心脏疾病的风险评分。

挑战:查看整张图片

M regle的中心前提是,不同的临床方式,尤其是与单器官系统有关的临床方式(例如循环系统),同时编码互补和重叠的信息。例如,在12个铅的心电图中,不同的导线放在体内不同的位置。为了确定心脏病发作的位置或诊断心律失常,医生分析了特定潜在客户的信息。在表示学习过程之前结合了多种模态(例如ECG的12条或一个铅和PPG数据)的M-Regle方法,它提供了一种更准确的工具,擅长寻找遗传关联,分析复杂的生理数据并预测疾病。

为了有效地做到这一点,M-Regle采用了使用联合学习的强大,多步进的方法。M-雷格首先将它们分别结合在一起,而不是分别查看12个不同的ECG引线或ECG和PPG波形。然后使用一个卷积 变量自动编码器(CVAE)从这些多个数据流中学习一个压缩的,合并的“签名”(潜在因素)。CVAE旨在捕获低维,在很大程度上不相关的表示中捕获最重要的信息。它由编码器和解码器网络组成,其中编码器将ECG和PPG波形压缩为潜在因素,而解码器网络从创建的潜在因子重建了波形。确保学习的因素是真正独立的,主成分分析(PCA)应用于这些CVAE生成的特征。最后,我们通过计算的独立因素和遗传数据之间的关联(显着相关)通过全基因组关联研究(GWAS)。这些单独的GWA的结果在统计上合并到与潜在生理系统相关的遗传变异。

更好的学习表现

M-Regle进步U-Regle以始终如一地产生数据的“学会表示”。医疗数据,例如心电图,由数百个单个数据点组成。当分析多种医学方式时,M-Regle并没有单独处理模式,而是捕获了最重要的特征并将其凝结到潜在因素中。与分别从每个模态中学习相比,这种方法导致重建错误的明显降低,并从原始波形中捕获了基本信息,从而做出了更好的工作。对于12导管的ECG,M regle将重建误差降低了72.5%。

可解释性阐明了嵌入

生成AI的优点之一是其可解释性能力。在我们的研究中,我们使用M-Regle嵌入来显示这些嵌入与ECG和PPG波形之间的联系,特别是改变单个嵌入坐标的人如何从M-Regle解码器改变重建的ECG和PPG波形。

我们专注于确定最能区分有和没有房颤的样品(AFIB)的坐标。发现位置4、6和10处的M regle嵌入是最独特的。当我们从[-2,2]中更改第4个M regle嵌入的值时,同时将其余的M-Regle嵌入固定固定时,我们观察到了重建的ECG Lead I和PPG中相应的更改:T波ECG铅I的段变化幅度,PPG信号的可毒缺口显示出较小的改变。可食用的缺口提供了有关心血管功能和健康的宝贵信息。例如,一个较不突出或不存在的双子缺口通常与动脉刚度增加有关。

增强的遗传发现

M-雷格还改善了u-Regle,以鉴定与心血管疾病的遗传关联。对于12个铅ECG,M-雷格(M-Regle)鉴定出相关的遗传基因座(基因组中的区域)比单峰方法多19.3%。对于ECG Lead I + PPG,M-Regle发现了13.0%的基因座。重要的是,这些发现中的绝大多数(12铅ECG的24/35和ECG铅I + PPG的11/12)复制了已知的ECG或PPG特征的已知遗传关联GWAS目录。M-Regle还发现了以前与这些特征相关的几个新基因座,其中一些在其他数据库中显示了与心血管性状的链接。

改善多基因风险得分

一个多基因风险评分(PR)量化个人患疾病的遗传风险。我们发现,使用M-雷格(M-Regle)鉴定的遗传变异(从12铅ECG数据)中开发的PR显着超过了U-Regle的PR在预测心脏病方面,最著名的是在心房颤动(AFIB)中。M-Regle的PR在识别有风险的人方面要好得多。这些对AFIB的PRS改进不仅在英国生物库,但也可以在其他大型数据集中独立验证,例如印第安纳州生物库,,,,Epic-Norfolk英国妇女的心脏和健康研究

为什么M- regle起作用?

M- reglegle的力量在于它如何处理信息。通过考虑多种方式,M-雷格获得了三个主要优势。首先,它有效地捕获了共享信息,一次学习一次,而不是多次在每种模式中进行多次学习。其次,它增强了每种方式提供的独特和互补信号。第三,M- regle降低了噪声,因为来自一种方式的信息可能有助于澄清或过滤另一种噪声。这一切都导致了更清晰,更强大的信号,以实现强大的下游遗传分析。

未来是多模式的

这项研究是利用丰富的多式模式健康数据越来越多的一步。M-Regle提供了一种发现与复杂疾病的新遗传联系,提高我们预测疾病风险的能力的方法,并有可能确定疗法的新靶标。此外,随着智能可穿戴设备的兴起不断收集ECG和PPG等生理数据,M-Regle等方法对于将健康数据转化为见解,最终是更好的健康结果至关重要。

致谢

这项工作代表了许多贡献者和机构的协作成就。我们衷心感谢合作者的重要意见:Yuchen Zhou,Justin Cosentino,Howard Yang,Andrew Carroll,Cory Y. McLean,Babak Behsaz(Google);Zachary R. McCaw(北卡罗来纳大学);Tae-Hwi Schwantes-an,Dongbing Lai(印第安纳大学);Mahantesh I. Biradar,Robert Luben,Jorgen Engmann,Rui Providencia,Anthony P. Khawaja(伦敦大学学院);Patricia B Munroe(伦敦皇后大学)。我们也感谢Anastasiya Belyaeva审查了手稿,Greg Corrado,Shravya Shetty和Michael Brenner的支持,以及Monique Brouillette在撰写此博客文章时提供了帮助。

关于《通过多模式AI解锁丰富的遗传见解》的评论


暂无评论

发表评论

摘要

研究人员开发了M-Regle,这是一种多模式版本的Remle,用于同时分析多种类型的临床数据,以了解心血管特征中的遗传发现。该方法将智能手表的各种生理数据流(例如ECG和PPG)与基因组信息相结合,以提供对心脏健康的更全面的理解。通过共同对这些互补数据源进行建模,M- regle降低噪声,提高信号的清晰度并改善与分别分析每种模态相比的遗传关联的鉴定。通过更好的多基因风险评分,它还优于预测心血管疾病,尤其是心房颤动的传统方法。这种方法旨在通过利用当今可用的多模式健康数据来提高我们预测疾病风险和发现新的治疗靶标的能力。