英语轻松读发新版了,欢迎下载、更新

EVO 2机器学习模型夺取了人工智能在打击疾病中的力量

2025-06-17 14:10:01 英文原文

作者:by Ty Burke, University of California - Berkeley

Evo 2 machine learning model enlists the power of AI in the fight against diseases
EVO 2的机械解释性揭示了DNA,RNA,蛋白质和生物体水平的特征。信用:Biorxiv(2025)。doi:10.1101/2025.02.18.638918

从小树蛙到高耸的红木到您和我的DNA驱动着地球上的所有生命。DNA嵌入了每个生物体中的每个细胞中,充当一种生物学指导手册,包含生命所需的所有遗传信息。

该过程始于转录:DNA制作其代码的一部分副本以产生RNA,这是一种可以催化生物反应的分子,以表达嵌入DNA中的信息。在这些反应中,蛋白质合成并成为活细胞。总之,这被称为分子生物学的中心教条:DNA产生RNA,RNA生成蛋白质。

一条DNA可以包含数百万对核苷酸,这是携带的分子构建块。一条RNA可以包含成千上万的RNA。核苷酸几乎有无数的方式可以合并成生命。组合的复杂性实在太大了,无法理解人类的意义。但这就是AI进来的地方。

生物工程助理教授帕特里克·胡(Patrick Hsu)说:“机器学习可以从大量数据集中汇总出更高阶的模式。”“ AI已经在,视觉和机器人技术。现在,我们正在生物学中这样做。”

在2025年2月,HSU和他的合作者发行在超过9.3万亿个核苷酸上训练的机器学习模型Biorxiv预印服务器。HSU称为EVO 2,将其与可以分析的生物学结构进行了比较大规模。它已经是生物学中最大的AI模型,有一天,EVO 2可以设计新的生物学工具和治疗方法。

他说:“现在,我们有很多观察数据。”“我们知道基因与疾病之间的相关性,但是我们仍然对因果关系不了解。具有预测因果关系的能力的某些东西真的很强大。”

这种类型的预测是EVO 2的近期视觉。HSU给出了BRCA1乳腺癌基因的例子。如果女人有BRCA1,她的一生患乳腺癌的风险大大增加。超过60%的BRCA1基因突变女性将在一生中的某个时候发展乳腺癌,而总体上只有13%的女性。一些BRCA1突变被称为致病性,而其他BRCA1突变是良性的。但是大多数突变是具有未知意义的变体。我们只是不知道它们做什么。

“如果您患有致病性突变,就会获得乳房切除术。如果您有良性突变,则会获得年度乳房X线照片。但是,如果您具有未知意义的变体,该怎么办?”问hsu。“事实证明,EVO 2对此有意见,并且该模型是对BRCA1突变的致病性进行分类的最新方法。预测哪些突变是良性的良性,其准确性超过90%。”

预测生物学特性

EVO 2是湾区独立非营利组织的产物,称为ARC Institute,该研究所与生物工程师和神经科学家Silvana Konermann共同创立了该研究所。该研究所旨在加快科学进步并加深我们对疾病根本原因的理解,并将领先来自UC Berkeley,UCSF和Stanford。

AI模型以其前身为基础evo 1,它于2024年推出,并完全接受了单细胞生物的培训。EVO 2将其提高了几个档次。该模型接受了大量生物学信息的训练,其中包括超过128,000个全基因组和9.3万亿个核苷酸,从整个生命之树(包括细菌,植物和动物)中的100,000种物种进行了培训。

有五个构成DNA和RNA的碱基核苷酸:腺嘌呤(A),胞嘧啶(C),鸟嘌呤(G),胸腺胺(T)和尿嘧啶(U)。DNA包含A,C,G和T,而RNA包含A,C,G和U。我们的遗传物质是由这些核苷酸制成的,以无数的不同序列制成,EVO 2使用此信息来对这些序列中最有可能发生的最有可能发生的概率预测。

该模型使用类似于驱动众所周知的大语言模型的原则,例如Openai的Chatgpt或Anthropic的Claude。为了建立这种尖端的模型,研究人员与行业领先的AI芯片制造商Nvidia合作。

“一个HSU说:“预测模型处理的基本数据单元的下一个术语。如果您要求它完成句子“要成为或不成为”,那是一个很高的概率”,这将是接下来的问题。因为,哈姆雷特。但是,接下来在一系列核苷酸中发生的事情还不太清楚。如果我给您一个诸如'g,t,g,c,a,t,c的序列,那么您会预测下一个是“ c”或“ g”?你不知道,我也不知道。但是,AI模型可以基于序列变化捕获复杂的生物学特性。”

EVO 2是一种从未说过的语言的大型语言模型,仅以物理形式表达 - 无论是癌性肿瘤的生长还是婴儿眼的颜色。EVO 2可以一次处理多达一百万个核苷酸,因此它可以在数据中挑选模式并确定与基因组其他部位的关系。

这不仅可以预测基因突变是否可能是致病性的。它还可以预测可能治疗疾病并提供有关导致其进展的生物学机制的疗法。它甚至可以帮助指导方向带。

HSU说:“研究人员已经能够比以往任何时候都能生成更大的数据集,并且进行更大的实验。但是,尚不清楚这比以往任何时候都更具见解。”“即使是最大的数据集,相对于生物学的复杂性,也很小。这就是机器学习模型的来源。我们可以采用大量的生物学数据集并训练模型,以在数据中找到比我们甚至可以想象的更复杂的数据。”

“效率真的很重要”

在大多数情况下,生物学科学通过反复试验的过程发展。研究人员提出了假设,在科学实验中对其进行了测试,并分析了结果。然后,研究人员继续进行下一个假设。等等。

这种方法是耗时的,但是它产生的结果比以往任何时候都更长。新医疗治疗的临床试验需要数年的时间进行,而绝大多数新治疗绝不会进入市场。HSU将过程与加利福尼亚山区的徒步旅行进行了比较。

胡子说:“成为一名生物医学研究人员可能会感觉像在旷野行走。”“你看到远处的高峰,然后走向它。然后,走了三个小时,你意识到自己还没有靠近。您需要决定是否完全朝着正确的方向行走。”

在生物学中,实验倾向于在几天,几周,几个月和几年的生活时间内展开。而且,如果您朝着错误的方向前进,那么您可能会暂时偏离路线。

他说:“效率确实很重要。您可以花费数年的时间来处理错误的事情,而不幸。”“我们在生物学方面确实走了很远,几乎是猜测和检查。”

EVO 2研究人员的主要目的之一是使用AI加速发现对实际疗法的发展。该概念在19009年的大流行中有根源,后者看到mRNA疫苗被广泛部署。

生物技术公司Amgen全球研究高级副总裁兼前ARC Institute研究员霍华德·张(Howard Chang)说:“这一突破是60年的制作。”“ Messenger RNA在1961年被发现是一个基本的生物实体。它不应该花那么长时间。”

根据Chang的说法,EVO 2已经可以做可以有助于加快过程的事情。它能够准确预测哪些RNA基因对细胞功能至关重要,哪些RNA基因可分配。它可以告诉您哪些基因控制导致疾病的细胞行为。这可以使研究人员早些时候走上正确的道路。

张说:“如果您追踪容易患有特定疾病的单个家庭,则有许多继承差异将其映射到基因组上信息变化可能导致疾病的位置,但我们不确定它们是什么。EVO2允许我们确定这一点。”

他补充说:“如果EVO 2可以告诉我们,疾病会因为蛋白质过于活跃而发生疾病,我们知道问题是什么,我们可以尝试制造一种解决问题的药物。这是您对EVO 2的可能性。”“这是一种新的甲骨文。”

HSU认为,这种类型的进步将在分子生物学中尤其具有变革性。研究可能需要花费很多年才能完成,并且绝大多数临床试验失败了。

HSU说:“临床试验失败率为90%。因此,很多时候,我们只是在努力做错的药物目标。”“ AI可以帮助我们更有效地找到正确的目标。”

走向更健康的未来

对于HSU来说,追求复杂疾病的治疗方法是一项深切的个人努力。他的青春期前,他的祖父被诊断出患有阿尔茨海默氏病。他的祖父与家人住在一起,而Hsu见证了他不可避免的衰落。慢慢地,他意识到没有回来。神经退行性状况是无法治愈的,最终是致命的。

经验是形成性的。十几岁的时候,HSU曾在斯坦福大学的大学神经科学实验室工作。他在哈佛大学的研究生学习期间研究了阿尔茨海默氏症,这种疾病仍然是他在伯克利和ARC研究所工作的重点。

HSU说:“如果您查看30年前美国顶级杀手的名单,您会发现它们与今天相同:心脏病,癌症,阿尔茨海默氏症。”“这是一个非常可怕的情况。这意味着,尽管正在进行越来越多的生物医学研究,并且花了越来越多的钱,但我们并没有在治愈这些疾病方面取得越来越多的进步。”

HSU认为,AI对于改善事物至关重要。生物学的复杂性实在太大了,人类的思想无法完全努力并分析大量数据,这恰恰是AI擅长的。HSU设想了AI使生物分子研究更有效的未来,并可以根据患者的健康结果量身定制治疗。

HSU说:“我们不仅想了解特定的遗传突变的影响以及它们是否是疾病途径。”“我们希望使用EVO 2进行全基因组的关联研究,以确定健康的人和不健康的人,以确定哪些遗传突变与疾病相关,并告诉您对您自身的风险更具体的东西。我们希望更好地了解遗传组合并将其与您自己的健康记录和基因组相结合,以使您对健康做出更准确的预测。

更多信息:Garyk Brixi等人,通过EVO 2的所有生命领域的基因组建模和设计,Biorxiv(2025)。doi:10.1101/2025.02.18.638918

引用:EVO 2机器学习模型夺取了人工智能在打击疾病斗争中的力量(2025年,6月17日)检索2025年6月18日来自https://medicalxpress.com/news/2025-06-evo-machine-power-ai-diseases.html

该文档具有版权。除了为私人研究或研究目的的任何公平交易外,没有未经书面许可,可以复制部分。内容仅用于信息目的。

关于《EVO 2机器学习模型夺取了人工智能在打击疾病中的力量》的评论


暂无评论

发表评论