机器学习辅助全基因组关联研究的有效推理 - Nature.com

2024-09-30 09:37:51 英文原文

摘要

机器学习 (ML) 在几乎所有科学学科(包括人类遗传学)中变得越来越流行。由于样本收集和精确表型分析相关的挑战,机器学习辅助全基因组关联研究 (GWAS) 在复杂性状遗传学研究中变得越来越常见,该研究使用复杂的机器学习技术来估算表型,然后对估算结果进行 GWAS。然而,ML 辅助 GWAS 关联的有效性尚未经过仔细评估。在这里,我们报告了机器学习辅助 GWAS 中普遍存在的假阳性关联风险,并介绍了预测后 GWAS (POP-GWAS),这是一种根据机器学习估算结果重新设计 GWAS 的统计框架。POP-GWAS 确保有效且强大的统计推断,无论插补质量和算法选择如何,仅需要 GWAS 摘要统计数据作为输入。我们采用 POP-GWAS 对 14 个骨骼部位的双能 X 射线骨密度成像进行了 GWAS 分析,确定了 89 个新位点并揭示了骨骼部位特异性遗传结构。我们的框架为未来的机器学习辅助 GWAS 提供了强大的分析解决方案。

这是订阅内容的预览,可通过您的机构访问

访问选项

访问Nature 和其他 54 种 Nature Portfolio 期刊

获取 Nature,我们最超值的在线订阅

24,99 / 30 天

随时取消

p>

针对中国客户的订阅信息

我们为中国客户提供了专门的网站。请前往naturechina.com订阅该期刊。

购买本文

  • 在SpringerLink上购买
  • 即时访问全文PDF

价格可能需要缴纳结帐时计算的当地税

数据可用性

可提供骨骼部位特定 DXA-BMD 的 GWAS 摘要统计数据https://qlu-lab.org/data.html 和 NHGRI-EBI GWAS 目录 (https://www.ebi.ac.uk/gwas/home),登录号为 GCST90446627GCST90446644。

代码可用性

POP-GWAS 软件和用于 ML 辅助 GWAS 的功率计算器应用程序可在 https://github.com/qlu-lab/POP-TOOLS 上公开获取(参考文献 64)。分析代码可在 https://github.com/jmiao24/POP-GWAS_analysis(参考文献 65)获取。

参考文献

  • Uffelmann,E. 等人。全基因组关联研究。纳特。Rev.Methods Primers 1, 59 (2021)。

  • Dahl, A. 等人。表型整合提高了基于生物库的重度抑郁症遗传学研究的功效并保留了特异性。纳特。热内特.55, 20822093 (2023)。

  • An, U. 等人。基于深度学习的对人口规模生物库数据的表型插补增加了遗传发现。纳特。热内特.55, 22692276 (2023)。

  • Burstein, D. 等人。对模型衍生的暴食症表型进行全基因组分析,确定风险位点并暗示铁代谢。纳特。热内特.55, 14621470 (2023)。

  • Cosentino, J. 等人。通过对原始肺活量图的深度学习来推断慢性阻塞性肺疾病,可以识别新的遗传位点并改进风险模型。纳特。热内特.55, 787795 (2023)。

  • Kun, E. 等人。人类骨骼形态的遗传结构和进化。Science 381,eadf8009 (2023)。

  • Sethi, A.、Ruby, J. G.、Veras, M. A.,泰利斯,N.

关于《机器学习辅助全基因组关联研究的有效推理 - Nature.com》
暂无评论