此前曾遭到质疑的人工智能,在利用人工智能解决蛋白质折叠和设计问题后,为科学家们赢得了 2024 年诺贝尔化学奖,现在它已被全球生物学家所采用。人工神经网络和语言模型等人工智能模型可帮助科学家解决各种问题,从预测蛋白质的 3D 结构到从头开始设计新型抗生素。研究人员继续完善人工智能模型,解决其局限性并展示在生物学中的广泛应用。
诺贝尔人工智能奖:蛋白质折叠和设计历史回顾
诺贝尔奖获得者大卫·贝克 (David Baker) 使用深度学习模型从头创建蛋白质,这种蛋白质比天然蛋白质更适合解决现代问题。
伊恩·C·海顿
蛋白质折叠问题是蛋白质生物学家的一大痛点,现已被人工智能解决,赢得了华盛顿大学生物化学家的青睐大卫·贝克和 DeepMind 研究人员黛米斯·哈萨比斯和约翰·詹珀诺贝尔化学奖。经过大约二十年的努力,科学家们根据氨基酸序列确定了蛋白质的三级结构,建立了结构预测批判性评估 (CASP)1994 年举办的竞赛旨在促进这一领域的合作。1998 年,Baker 团队构建了用于蛋白质能量配置建模的 Rosetta 软件;事实上,几年后,该团队将他们的计算模型变成了一款名为 Foldit 的游戏,以吸引志愿者参与解决蛋白质结构。在 2018 年 CASP 上,DeepMind 团队公布了他们突破性的 AlphaFold 程序,该程序接受真实蛋白质序列和结构的训练。两年后,AlphaFold2 程序在准确预测蛋白质结构方面取得成功,专家们宣布蛋白质折叠问题已基本解决。2024 年,贝克、哈萨比斯和朱珀因他们的工作使人们能够更深入地了解蛋白质功能和应用而获得诺贝尔奖。
了解诺贝尔奖获奖发现背后的背景这里。
AlphaFold 激发了人工智能在生物学中的快速应用
随着 2018 年 AI 深度学习模型 AlphaFold 的发布,科学家们终于能够预测蛋白质的 3D 结构——这是生物学领域数十年的挑战。该模型经过 100,000 个已知蛋白质序列和结构的训练,不仅可以以接近实验水平的精度准确预测蛋白质结构,还可以用于从头设计蛋白质,用于治疗学及其他领域的各种应用。受到 AlphaFold 成功的启发,科学家们现在正在使用深度学习模型来创建细胞的时空图,分析细胞图像以检测表明疾病的形态变化,并估计新药在阻止疾病进展方面的功效,以最大限度地减少细胞损失。药物发现管道。专家喜欢麦迪森·马萨利Deepcell 的工程师科学家兼首席执行官,他对人工智能在生物学中的快速采用感到高兴,但他警告说,研究人员需要大量的专业知识才能利用人工智能进行生物应用。
探索人工智能在生物学中的广泛应用这里。一个
De Novo 蛋白质应对 21英石世纪问题
使用先进的机器学习工具,研究人员可以创造具有新功能的人造蛋白质。
伊恩·C·海顿
利用人工智能模型的力量,科学家现在能够设计具有特定生物功能的定制蛋白质,使它们能够解决自然界中发现的蛋白质无法解决的问题。传统的蛋白质工程基于增量改变并观察其影响,但机器学习模型既可以设计更好的蛋白质,又可以显着加快这一过程。蛋白质设计专家大卫·贝克和他在华盛顿大学的团队使用几种不同的人工智能模型来设计稳定的荧光素酶,可以与合成荧光素结合发光,并应用于动物组织的深度成像。虽然这种类型的蛋白质设计还有改进的空间,并且尚未完全自动化,但它可以在未来用于创建各种用于治疗和其他目的的蛋白质。
了解有关从头蛋白质的更多信息这里。一个
AI 发现针对耐药细菌的新型抗生素
Jon Stokes 和他的团队开发了 SyntheMol,这是一种生成人工智能模型,他们用它来制造新型抗生素,并预测对 ESKAPE 病原体的功效,鲍曼不动杆菌。
麦克马斯特大学
使用人工智能从头设计蛋白质可能会成为抗生素开发的一大福音。随着全球范围内抗生素耐药性发生率的增加以及新抗生素的缺乏,麦克马斯特大学的研究人员转向人工智能来设计易于合成的新型抗生素。由生物化学家领导乔恩·斯托克斯,该团队开发了一种名为 SyntheMol 的生成式 AI 模型,用于设计具有抗菌活性的小分子鲍曼不动杆菌,一种被世界卫生组织认为对全球健康构成重大威胁的耐药病原体。尽管尚未在人体中进行测试,但其中一些分子在体外抑制了目标细菌以及其他耐药微生物的生长。
深入研究人工智能生成的抗生素在本文中。一个
人工神经网络像人脑一样学习
受人脑的启发,人工神经网络 (ANN) 是一种机器学习模型,包含可以处理数据的多层互连节点(或神经元)。网络中的每个节点使用加权输入数据执行数学方程,并根据阈值确定输出是否将传递到下一层节点。科学家使用具有已知值或特征的数据集训练人工神经网络,然后让它根据每个样本的真实答案评估其预测输出,以便随着时间的推移提高其准确性。然后,人工神经网络可用于预测新数据集的结果。尽管存在一些关键限制,人工神经网络仍可以识别人类可能无法识别的复杂数据中的模式,并执行琐碎的任务,为研究人员腾出时间。
阅读有关神经网络的更多信息在这篇解释文章中。一个
大型语言模型帮助我们理解大脑
研究人员现已开发出一种语言模型(负责 ChatGPT 的深度学习模型类型),可以通过大脑 MRI 图像确定一个人的想法。亚历山大·胡特德克萨斯大学奥斯汀分校的研究人员创造了这项技术,目的是让无法说话的人能够进行交流,但它也揭示了有关人类大脑功能的见解。胡斯的模型表明,即使 MRI 扫描显示只有前额叶皮层处于活跃状态,大脑的所有部分都会使用与意义相关的信息。虽然该模型不能推广到不同的主题,这意味着它无法读懂思想,但专家建议谨慎行事,因为这些模型将来会变得更加准确。
了解有关语言模型及其在生物学中的应用的更多信息在本文中。一个
使用人工智能预测基因表达
虽然 ChatGPT 用于预测句子中的下一个单词,但科学家现在已经创建了类似的深度学习模型,可以预测单个细胞中的基因表达。由计算生物学家创建王博和他在多伦多大学的团队合作,单细胞生成预训练变压器 (scGPT) 可以比当前几种最流行的方法更有效地分析单细胞 RNA 测序数据。该模型还能够比标准模型更准确地预测遗传扰动的影响。scGPT 最初针对骨髓和免疫细胞进行训练,现在已适用于分析各种其他细胞类型,并可在不久的将来用于回答重要的生物学问题。
继续阅读有关 scGPT 的内容这里。一个
人工智能模型在生物学中具有巨大的潜力,从帮助我们理解大脑到创造新的疗法,但专家警告说,它们的使用应该谨慎,它们的成功取决于知识的深度和广度。研究人员继续探索、开发和完善各种应用的深度学习模型,包括生物数据的解释和预测。