作者:Eric W. Dolan
推出了一种先进的机器学习模型,该模型可以使用有限的信息预测幼儿的自闭症谱系障碍,对于两岁以下的儿童,预测准确率接近 80%。该模型名为 AutMedAI,旨在使用常规儿科就诊期间经常可以获得的基本行为和医疗信息,使其既易于使用又实用,可在医疗保健环境中广泛应用。该模型可能有助于早期发现自闭症,有助于更快地提供必要的干预措施以增强发育成果。
自闭症谱系障碍是一种神经发育疾病,影响个体感知周围世界以及与周围世界互动的方式。其特点是社交沟通困难、行为重复、兴趣有限。自闭症患者可能在理解社会线索、建立关系和适应新环境方面遇到困难,症状从轻微到严重不等。
虽然自闭症的病因很复杂,涉及遗传和环境因素,但早期干预已被证明对自闭症儿童大有裨益,特别是在改善社交、沟通和行为技能方面。然而,诊断自闭症可能具有挑战性,因为它通常依赖于观察特定的行为,而这些行为可能要到生命的最初几年后才会完全出现。这导致自闭症早期症状首次出现与通常做出诊断之间存在差距,从而延迟了可能有用的干预措施。
这项研究背后的动机在于解决当前自闭症筛查和诊断工具的局限性。传统的筛查通常依赖于问卷和检查表,它们很有用,但可能会错过微妙的迹象,可能会受到解释偏差的影响,并且通常需要专业知识才能进行准确评估。这些工具可能会延迟诊断,因为它们通常针对已经表现出明显自闭症迹象的儿童,通常在三岁左右或更大。
瑞典卡罗林斯卡学院的研究人员旨在开发一种更易于使用、更准确的工具,可以利用现成的医疗和发育数据来识别幼儿的自闭症风险。通过创建一个机器学习模型来分析常见的早期生活因素(例如第一次微笑的年龄或语言里程碑),他们希望能够促进自闭症风险的早期识别。这种早期发现可以为及时干预和更好的发展支持打开大门,最终改善自闭症儿童及其家庭的结局。
研究人员使用了 SPARK(西蒙斯基金会为自闭症研究知识提供动力)数据库的数据,该数据库是美国最大的自闭症研究数据集之一。SPARK 数据库包含超过 30,000 名自闭症和非自闭症儿童的详细医疗和背景信息。在这项研究中,团队重点关注了 SPARK 约 12,000 名儿童的样本,以训练和验证他们的机器学习模型。选择的数据仅包含通常可从儿童早期常规医疗就诊中获得的信息,例如关键发育里程碑的年龄和特定行为特征。
为了构建该模型,研究人员使用了 28 个不同的因素,这些因素经过精心挑选,易于获取、非侵入性且易于家长报告。这些因素包括可观察到的里程碑,例如孩子第一次微笑、形成简短句子或对某些食物有困难的时间。该研究的重点是 24 个月以下的儿童,这是发育评估的关键时期。该团队使用了各种机器学习算法,包括逻辑回归和随机森林,来探索解释这些数据的不同方法。经过多轮测试和改进,他们最终选择了性能最佳的模型 AutMedAI,以最大限度地提高预测准确性,同时保持用户友好性并基于现成的数据。
AutMedAI 在 SPARK 数据集上进行了训练和验证,该数据集被分为多个子集以允许严格的交叉验证。具体来说,数据被划分为 60% 用于训练,20% 用于调整模型参数,剩余 20% 用于最终验证。这种方法有助于确保模型不仅在用于训练的样本中准确,而且对于“看不见的”数据也准确,模仿现实世界的应用。研究人员通过优化模型以防止过度拟合,进一步完善了模型,确保其能够很好地推广到新案例。
AutMedAI 模型对大约 12,000 名儿童的样本进行了评估,在预测自闭症方面达到了约 80% 的准确率,正确识别了很大一部分患有自闭症谱系障碍的儿童。该模型特别有效地标记出在社交互动和认知功能方面存在更严重困难的儿童,这两个领域与自闭症密切相关。
“这项研究的结果意义重大,因为它们表明可以从相对有限且容易获得的信息中识别出可能患有自闭症的个体,”该研究的第一作者、卡罗林斯卡医学院的附属研究员 Shyam Rajagopalan 说。Institutet,目前是印度生物信息学和应用技术研究所的助理教授。
该模型中出现了几个具体因素作为强有力的预测因素,包括孩子第一次微笑的年龄、他们开始使用短句的时间以及是否存在饮食困难。这种预测因素的组合既富有洞察力又实用,表明共同的发展里程碑在集体分析时可能是自闭症风险的有力指标。
研究人员强调,AutMedAI 并不是要取代详细的临床评估,而是作为初步筛查工具。通过标记可能需要进一步评估的儿童,该模型可以帮助缓解诊断服务的压力,并为家庭提供有关孩子发育的早期见解。
早期干预对于自闭症儿童尤其重要,因为有针对性的治疗和支持系统可以显着改善长期结果,特别是在沟通和社交技能方面。该模型的可及性还为农村或服务欠缺地区带来了希望,这些地区的专业自闭症诊断服务可能较少,为初步筛查提供了宝贵的选择。
AutMedAI 最有前途的方面之一是它依赖于无需侵入性测试或广泛的临床评估即可收集的数据,使其可以融入常规儿科护理中。研究人员计划在临床环境中进行进一步的测试和验证,以确认该模型在研究环境之外的可靠性。他们还在探索在模型的未来迭代中包含遗传信息的潜力,这可以进一步提高准确性并实现更加个性化的筛查。
– 为了确保模型足够可靠,可以在临床环境中实施,需要进行严格的工作和仔细的验证。我想强调的是,我们的目标是让该模型成为医疗保健的一个有价值的工具,而不是为了取代对自闭症的临床评估。”KIND 妇女系副教授 Kristiina Tammimies 说道。卡罗林斯卡学院儿童与健康中心以及该研究的资深作者。
这项研究,——从最少的医学和背景信息中机器学习预测自闭症谱系障碍, — 由 Shyam Sundar Rajagopalan、Yali Zhu、Ashraf Yahia 和 Kristiina Tammimies 撰写。