英语轻松读发新版了,欢迎下载、更新

Google DeepMind揭开字母组合:用于高分辨率基因组解释的统一AI模型

2025-07-01 05:01:19 英文原文

作者:Robert Krzaczyński

Google DeepMind宣布发布字母内组这是一种新的AI模型,旨在预测遗传变异如何影响整个基因组的基因调节。它通过将远程序列上下文与单个通用物质结构中的基本对分辨率整合在一起,代表了计算基因组学的显着进步。

字母型的过程一次最高100万个DNA碱基对,并在包括基因表达,染色质访问性,转录起始位点,RNA剪接和蛋白质结合的包括基因表达,染色质访问性,转录启动位点,包括基因表达,转录启动位点和蛋白质结合的高分辨率预测。它允许研究人员评估常见变体和稀有变体的影响,不仅在蛋白质编码区域中,而且在占人类基因组98%的非编码调节区域中更为复杂。

从技术上讲,字母组合结合了卷积神经网络(CNN),以检测局部序列基序和变压器以建模远程相互作用,所有这些相互作用均经过编码,GTEX,4D核心和Fantom5的富含多OMIC数据集训练。该体系结构在广泛的基因组基准中实现了最新的性能,在26个变异效应预测评估中,有24个在24个评估中,超过了特定于任务的模型。

一个值得注意的创新是字母直接建模RNA剪接连接的能力,这对于理解剪接误差引起的许多遗传疾病至关重要。该模型还可以对比鲜明的突变序列和参考序列,以量化组织和细胞类型的变体的调节影响 - 研究与疾病相关的基因座和解释全基因组关联研究(GWAS)的关键能力。

训练效率也提高了:通过优化的架构和数据管道,使用了DeepMind早期的Enformer模型的一半计算预算,在短短四个小时内就在TPU上进行了完整的字母组模型。

该模型现在可以通过字母型API对于非商业研究的使用,使科学家能够大规模产生功能假设,而无需结合不同的工具或模型。DeepMind指出了进一步扩展到新物种,任务和微调临床应用的计划。

该版本还与医学中AI的解释性和情感环境进行了更广泛的对话。作为AI对准研究员Graevka Suvorov,评论

Medgemma的真正领域不仅诊断准确性,而且还具有在患者中创造的信息和心理状态。没有上下文的诊断是可以引起恐惧的数据点。清晰提供的诊断是康复的第一步。一个真正的“信息床边方式”的人工智能是理解它的不仅仅是对待图像,而且一个人的整个现实是AGI的下一个真正的飞跃。

字母肌元组将场地更接近该视野,从而使对基因组的更深入,更准确地解释,并为在序列水平上理解生物学的统一模型提供了统一的模型。

关于《Google DeepMind揭开字母组合:用于高分辨率基因组解释的统一AI模型》的评论


暂无评论

发表评论

摘要

Google DeepMind发布了Alphagenome,这是一种AI模型,旨在预测遗传变异如何影响整个基因组的基因调节。它将远程序列上下文与使用卷积神经网络和变形金刚的基本对分辨率集成在一起,从而在变异效应预测中实现了最新性能。字母型的过程可立即进行100万个碱基对DNA,并为各种分子方式输出高分辨率预测。值得注意的是,它可以直接建模RNA剪接连接并量化组织之间的调节影响。该模型在四个小时内对TPU进行了有效的培训,从而通过API提供了非商业研究的使用。字母组合被视为计算基因组学的重大进步,并与改善AI在医疗应用中的可解释性相一致。