十多年前,研究人员启动了BabySeq项目,该项目是一项试点计划,旨在将新生儿基因组测序结果归还给父母,并衡量对新生儿护理的影响。如今,超过30项国际倡议正在探索使用基因组测序(NBSEQ)扩展新生儿筛查的扩展,但是大规模杨百翰,杨百翰的研究人员的一项新研究突出了这些程序中基因选择的实质性变异性。在发表的论文中医学遗传学这是美国医学遗传学与基因组学学院的官方杂志,他们提供了一种数据驱动的方法来优先考虑基因以供公共健康考虑。
至关重要的是,我们对基因组新生儿筛查计划中的哪些基因和条件进行考虑。通过利用机器学习,我们可以提供一种工具,以帮助决策者和临床医生做出更明智的选择,最终改善基因组筛查计划的影响。”
马萨诸塞州综合医院(MGH)的Nina Gold,医学博士,共同担任作者,产前医学遗传学和代谢总监
作者介绍了一个机器学习模型,该模型将结构和一致性带入了NBSEQ程序的基因选择。这是由高级作家罗伯特·C·格林(Robert C.
研究人员分析了27个NBSEQ程序中包含4,390个基因,从而确定了影响基因包含的关键因素。尽管每个程序分析的基因数量范围为134至4,299,但只有74个基因(1.7%)始终包含在80%以上的程序中。基因纳入的最强预测指标是该状况是否在美国建议使用的统一筛选面板,具有强大的自然历史数据,以及是否有强有力的治疗证据功效。一个
使用这些见解,团队开发了一个机器学习模型,其中包含13个预测指标,在预测跨程序的基因选择方面非常准确。该模型提供了可以适应新证据和区域需求的基因清单,从而在全球NBSEQ计划中更加一致,明智的决策。”
格林说:“这项研究代表了协调NBSEQ计划并确保基因选择反映最新的科学证据和公共卫生优先事项的重要一步。”