到处都是科学家现在可以访问EVO 2,这是一个强大的新的基础模型这了解生命所有领域的遗传密码。今天,它是基因组数据的最大公开AI模型,它是由非营利生物医学研究组织ARC Institute和Stanford University领导的NVIDIA DGX Cloud平台建立的。
EVO 2可供全球开发人员使用Nvidia Bionemo平台,包括作为NVIDIA NIM微服务,可轻松,安全的AI部署。
在近9万亿个核苷酸的巨大数据集上训练 - 可以将DNA和RNA evo 2的构件应用于生物分子研究应用,包括根据其遗传序列预测蛋白质的形式和功能,确定新的分子的新分子。医疗保健和工业应用,并评估基因突变如何影响其功能。
ARC Institute联合创始人兼核心调查员Patrick Hsu说,EVO 2代表了生成基因组学的主要里程碑,也是加利福尼亚大学伯克利分校的生物工程助理教授。•通过促进我们对这些基本生活基础的理解,我们可以在今天无法想象的医疗保健和环境科学方面寻求解决方案。”
NvidiaEVO 2的NIM微服务使用户能够生成各种生物序列,并具有设置来调整模型参数。对其专有数据集中的微调EVO 2感兴趣的开发人员可以通过开源来下载该模型Nvidia Bionemo框架,用于生物分子研究的加速计算工具的集合。
斯坦福大学化学工程助理教授,Dieter Schwarz Foundation Stanford Data Science Felly和ARC Institute Innovation Innovation研究员Brian Hie说,设计新生物学传统上是一个艰辛,不可预测和手工艺的过程。``使用EVO 2,我们使研究人员更容易访问复杂系统的生物学设计,从而在以前所花费的时间内实现了新的和有益的进步。
启用复杂的科学研究
ARC Institute于2021年以6.5亿美元的价格建立了6.5亿美元,使研究人员能够通过为科学家提供多年资金来应对长期的科学挑战 - 让科学家专注于创新研究而不是赠款写作。
它的核心调查人员将获得最先进的实验室空间和八年可再生条款的资金,可以与该研究所的一名大学合作伙伴之一同时任命,其中包括斯坦福大学,加利福尼亚大学,伯克利和加利福尼亚大学旧金山。
通过将这种独特的研究环境与NVIDIA的加速计算专业知识和资源相结合,Arc Institute的研究人员可以从事更复杂的项目,分析较大的数据集并更快地实现结果。它的科学家专注于疾病区域,包括癌症,免疫功能障碍和神经退行性。
NVIDIA通过使科学家通过2,000 nvidia h100 gpus访问EVO 2项目。NVIDIA DGX云在AWS上。DGX Cloud提供了对大型计算集群的短期访问,从而使研究人员具有创新的灵活性。完全管理的AI平台包括Nvidia Bionemo,其中以NVIDIA NIM微服务和Nvidia Bionemo蓝图的形式具有优化的软件。
NVIDIA的研究人员和工程师还与AI扩展和优化密切合作。
生物分子科学的应用
EVO 2可以提供有关DNA,RNA和蛋白质的见解。在生活领域进行了各种各样的物种培训,包括植物,动物和细菌 - 该模型可以应用于医疗保健,农业生物技术和材料科学等科学领域。
EVO 2使用一种新型的模型架构,可以处理冗长的遗传信息序列,最多100万个令牌。对基因组的这种扩展的看法可以使科学家了解生物体遗传密码的遥远部分与细胞功能,基因表达和疾病的机制之间的联系。
hsu说:'hsu说:“一个人的基因包含数千个核苷酸,因此AI模型可以分析这种复杂的生物系统如何工作,它需要立即处理遗传序列的最大可能部分。”
在医疗保健和药物发现中,EVO 2可以帮助研究人员了解哪些基因变异与特定疾病并设计了精确针对这些区域以治疗该疾病的新分子。例如,来自斯坦福大学和ARC研究所的研究人员发现,在与乳腺癌相关的基因的测试中,EVO 2可以以90%的准确性预测,是否以前未识别的突变是否会影响基因功能。
在农业方面,该模型可以通过提供植物生物学的见解并帮助科学家开发出更为气候富度或更营养的农作物来帮助解决全球粮食短缺。在其他科学领域,EVO 2可以应用于设计分解油或塑料的生物燃料或工程蛋白。
ARC的首席技术官Dave Burke说,部署像Evo 2这样的模型就像将强大的新望远镜发送到宇宙最远的范围。我们知道有巨大的探索机会,但我们还不知道我们会发现什么。
阅读有关EVO 2的更多信息NVIDIA技术博客并在ARC的技术报告。
看 注意关于软件产品信息。