Evo——一种基于人工智能的模型,用于破译和设计基因序列

2024-11-15 15:40:01 英文原文

作者:by Bob Yirka , Phys.org

Evo—an AI-based model for deciphering and designing genetic sequences
Evo 是一个包含 70 亿参数的基因组基础模型,可以学习从单个核苷酸到整个基因组的生物复杂性。信用:科学(2024)。DOI:10.1126/science.ado9336

Arc 研究所和斯坦福大学的计算机科学家、生物工程师和人工智能专家开发了一种基于人工智能的模型,能够解码和设计基因序列。在他们的发表在期刊上科学,该小组描述了设计和构建模型的因素,他们将其命名为 Evo,并列出了该模型的多种可能用途。

格拉德斯通心血管疾病研究所的克里斯蒂娜·西奥多里斯 (Christina Theodoris) 发表了一篇透视片在同一期期刊中,概述了研究人员所做的工作,并建议 Evo 的开发可能对以下领域产生重大影响:并治疗未来的疾病。

随着 ChatGPT 等法学硕士的出现,已经开发出的工具可能会产生远远超出文本、图像或视频生成的影响。用大量数据训练计算机以帮助其学习,为广泛的研究机会打开了大门。在这项新研究中,研究人员用 DNA 数据训练了一台计算机,然后用它来创造新的东西。这Evo不仅可以解码基因序列,还可以设计新的基因序列。

研究小组用数据对 Evo 进行了训练,这些数据显示 DNA 链如何随着时间的推移而进化,以及这些变化在给定的有机体中产生了什么。例如,在收到多种细菌的多个样本后,Evo 了解了它们的 DNA 是如何运作的。这使得该模型能够设计一个全新的微生物基因组。

为了使其具有基本的使用水平,研究人员使用 270 万个微生物基因组对 Evo 进行了训练,其中包括来自针对病毒的细菌类型的数百万个基因序列,这个过程花了四个星期。值得注意的是,该模型能够读取核苷酸水平的数据,使其能够了解即将产生的 DNA 链的构建模块。

该模型的初始测试包括要求 Evo 预测在特定突变的情况下蛋白质会发生什么。他们将其结果与人类在实验室中进行的实验结果进行了比较,发现它们具有可比性。不同之处在于,Evo 能够在几分钟内完成科学家们花费多年努力的工作。

研究小组表示,他们的模型很快就会改变这种方式进行。

更多信息:Eric Nguyen 等人,使用 Evo 从分子到基因组规模进行序列建模和设计,科学(2024)。DOI:10.1126/science.ado9336

克里斯蒂娜·V·西奥多里斯 (Christina V. Theodoris),《学习 DNA 语言》,科学(2024)。DOI:10.1126/science.adt3007

© 2024 Science X 网络

引文:Evo——基于人工智能的模型,用于破译和设计基因序列(2024 年,11 月 15 日)检索日期:2024 年 11 月 16 日来自 https://phys.org/news/2024-11-evo-ai-based-deciphering-genic.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。

关于《Evo——一种基于人工智能的模型,用于破译和设计基因序列》的评论


暂无评论

发表评论