英语轻松读发新版了,欢迎下载、更新

通过混合深度学习引导的生成式人工智能重塑自组装肽的发现

2024-11-19 11:09:22 英文原文

作者:Mauša, Goran

Lampel, A. 受生物学启发的超分子肽系统。

  1. 化学6 ,1222 - 1236 (2020)。文章

    一个 谷歌学术一个 Jankoviä, P.、Åantek, I.、Pina, A. S. 和 Kalafatovic, D. 利用肽自组装来开发简约病毒模拟物。正面。

  2. 化学。9 ,723473(2021)。文章

    一个 谷歌学术一个 弗雷德里克斯,P.W.等人。探索(三)肽自组装的序列空间,以设计和发现新的水凝胶。

  3. 纳特。化学。 7,30-37 (2015)。

    文章一个 谷歌学术一个 

  4. Lampel, A.、Ulijn, R. 和 Tuttle, T. 通过定向发现指导肽纳米技术的原则。化学。苏克。牧师。 47,3737–3758 (2018)。

    文章一个 谷歌学术一个 

  5. 莱文,A.等人。用于功能材料的仿生肽自组装。纳特。化学牧师。 4,615–634 (2020)。

    文章一个 谷歌学术一个 

  6. Chatterjee, A.、Reja, A.、Pal, S. 和 Das, D. 用于生化转化的肽组装系统化学。化学。苏克。牧师。 51,3047–3070 (2022)。

  7. Ramakrishnan, M.、van Teijlingen, A.、Tuttle, T. 和 Ulijn, R. V. 在基于肽的超分子材料和系统的设计中集成计算、实验和机器学习。安吉乌。化学。国际。埃德。 62,e202218067 (2023)。

  8. 兰佩尔,A.等人。具有序列编码特性的聚合肽颜料。科学 第356章,1064–1068 (2017)。

    文章一个 谷歌学术一个 

  9. 史密斯,D.J.等人。用于缝合超小血管的多相变肽水凝胶。纳特。纳米技术。 11,95-102 (2016)。

    文章一个 谷歌学术一个 

  10. 巴特拉,R.等人。机器学习克服了人类在发现自组装肽方面的偏见。纳特。化学。 14,1427 - 1435 (2022)。

  11. Pierce, N. A. 和 Winfree, E. 蛋白质设计是 NP 难的。蛋白质工程。 15,779–782 (2002)。

    文章一个 谷歌学术一个 

  12. 胡,K.等人。由环大小控制的受限环肽的自组装。CCS 化学。 2,42–51 (2020)。

    文章一个 谷歌学术一个 

  13. 胡,K.等人。通过链内手性中心调节肽自组装。科学。副词。 4,5907(2018)。

    文章一个 谷歌学术一个 

  14. Chan, K. H.、Lee, W. H.、Ni, M.、Loo, Y. 和 Hauser, C. A. 超短肽的 C 末端残基对分子自组装、水凝胶化以及与小分子药物的相互作用的影响。科学。代表。 8,17127(2018)。

    文章一个 谷歌学术一个 

  15. 金,J.等人。水在引导二苯丙氨酸组装成纳米管和纳米线中的作用。副词。马特。 22,583–587 (2010)。

    文章一个 谷歌学术一个 

  16. Nguyen,P.K. 等人。牙本质肽水凝胶的自组装。ACS欧米茄 3,5980 - 5987 (2018)。

    文章一个 谷歌学术一个 

  17. 严,X.等人。肽纳米管和类囊泡结构之间的可逆转变,包括理论建模研究。化学。欧元。J。 14,5974–5980 (2008)。

    文章一个 谷歌学术一个 

  18. Yang, K. K.、Wu, Z. 和 Arnold, F. H. 机器学习引导的蛋白质工程定向进化。纳特。方法 16,687–694 (2019)。

    文章一个 谷歌学术一个 

  19. Mandal, D.、Shirazi, A. N. 和 Parang, K. 肽自组装成纳米结构。组织。生物分子。化学。 12,3544–3561 (2014)。

    文章一个 谷歌学术一个 

  20. 什米洛维奇,K.等人。通过主动学习导向的粗粒度分子模拟发现自组装α-共轭肽。J. Phys。化学。乙 124,3873 - 3891 (2020)。

    文章一个 谷歌学术一个 

  21. Gocheva, G.、Peneva, K. 和 Ivanova, A. 通过分子动力学研究阿霉素和药物结合肽的自组装。化学。物理。 第525章,110380(2019)。

    文章一个 谷歌学术一个 

  22. 郭,C.,罗,Y.,周,R.&魏,G。三苯丙氨酸肽自组装成纳米球和纳米棒,与二苯丙氨酸肽形成的纳米囊泡和纳米管不同。纳米级 6,2800 - 2811 (2014)。

    文章一个 谷歌学术一个 

  23. Lee, O.-S.、Cho, V. 和 Schatz, G. C. 使用粗粒度分子动力学模拟肽两亲物自组装成纤维的过程。纳米快报。 12,4907–4913 (2012)。

    文章一个 谷歌学术一个 

  24. 豪瑟,C.A. 等人。天然三肽到六肽在水中通过意想不到的α螺旋中间结构自组装成淀粉样蛋白β型纤维聚集体。过程。国家科学院。科学。美国 108,1361 - 1366 (2011)。

    文章一个 谷歌学术一个 

  25. Frederix, P. W., Patmanidis, I. & Marrink, S. J. 自组装仿生超分子系统的分子模拟及其与实验的联系。化学。苏克。牧师。 47,3470 - 3489 (2018)。

    文章一个 谷歌学术一个 

  26. Takahashi, K.、Oda, T. 和 Naruse, K. 生物分子的粗粒度分子动力学模拟。目标生物物理学。 1,1-15 (2014)。

    文章一个 谷歌学术一个 

  27. Frederix, P. W.、Ulijn, R. V.、Hunt, N. T. 和 Tuttle, T. 二肽聚集的虚拟筛选:肽自组装的预测工具。J. Phys。化学。莱特。 2,2380 - 2384 (2011)。

    文章一个 谷歌学术一个 

  28. Zhou, P., Yuan, C. & Yan, X.理解和预测自组装肽水凝胶的计算方法。电流。意见。胶体界面科学。 62,101645(2022)。

  29. Palmer, N.、Maasch, J. R.、Torres, M. D. 和 de la Fuente-Nunez, C. 抗菌肽发现的分子动力学。感染。免疫。 89,00703-20(2021)。

    文章一个 谷歌学术一个 

  30. Wan, F.、Wong, F.、Collins, J. J. 和 de la Fuente-Nunez, C. 用于抗菌肽识别和设计的机器学习。纳特。比奥恩牧师。2,392–407 (2024)。达斯,P.等人。

  31. 通过深度生成模型和分子动力学模拟加速抗菌药物的发现。纳特。生物医学。英格。5 ,613–623 (2021)。吉田,M.等人。

  32. 使用进化算法和机器学习探索序列空间以发现抗菌肽。化学 4,533–543 (2018)。

    文章一个 谷歌学术一个 

  33. 曾,W.-F。等人。AlphaPeptDeep:一个模块化深度学习框架,用于预测蛋白质组学的肽特性。纳特。交流。 13,7238(2022)。

    文章一个 谷歌学术一个 

  34. Bukhari, S. N. H.、Webber, J. 和 Mehbodniya, A. 基于决策树的集成机器学习模型,用于预测寨卡病毒 T 细胞表位作为潜在候选疫苗。科学。代表。 12,7810(2022)。

    文章一个 谷歌学术一个 

  35. Melo, M. C.、Maasch, J. R. 和 de la Fuente-Nunez, C. 通过人工智能加速抗生素发现。交流。生物。 4,1050(2021)。

    文章一个 谷歌学术一个 

  36. Chen, J., Cheong, H. H. & Siu, S. W. XDeep-AcPEP:基于卷积神经网络和多任务学习的抗癌肽活性预测的深度学习方法。J.化学。信息。模型。 61,3789 - 3803 (2021)。

    文章一个 谷歌学术一个 

  37. 阿克巴,S.等人。iAtbP-Hyb-EnC:通过异构特征表示和基于遗传算法的集成学习模型预测抗结核肽。计算。生物。医学。 137,104778(2021)。

    文章一个 谷歌学术一个 

  38. 阿罗尼卡,P.G.等人。抗菌肽研究中的计算方法和工具。J.化学。信息。模型。 61,3172 - 3196 (2021)。

    文章一个 谷歌学术一个 

  39. 哈桑,M.M.等人。HLPpred-Fuse:通过融合多个特征表示,改进和稳健地预测溶血肽及其活性。生物信息学 36,3350 - 3356 (2020)。

    文章一个 谷歌学术一个 

  40. Manavalan, B.、Shin, T. H.、Kim, M. O. 和 Lee, G. AIPpred:使用随机森林进行基于序列的抗炎肽预测。正面。药理学。 9,276(2018)。

    文章一个 谷歌学术一个 

  41. 奥勒,M.等人。基于序列的含有非天然氨基酸的肽的固有溶解度预测。纳特。交流。 14,7475(2023)。

    文章一个 谷歌学术一个 

  42. 刘,Y.等人。进化神经架构搜索的调查。IEEE 传输。神经网络。学习。系统。 34,550–570,(2023)。

  43. Elsken, T.、Metzen, J. H. 和 Hutter, F. 神经架构搜索:一项调查。J·马赫。学习。资源。 20,1997 年至 2017 年(2019 年)。

    数学科学网一个 谷歌学术一个 

  44. 李,F.等人。自组装二肽水凝胶的设计和通过其化学特征进行机器学习。过程。国家科学院。科学。美国 116,11259–11264 (2019)。

    文章一个 谷歌学术一个 

  45. 徐,T.等人。通过人机交互加速肽水凝胶的预测和发现。纳特。交流。 14,3880(2023)。

    文章一个 谷歌学术一个 

  46. van Teijlingen, A. 和 Tuttle, T. 超越三肽两步主动机器学习,适用于非常大的数据集。J.化学。理论计算。 17 号,3221–3232 (2021)。

    文章一个 谷歌学术一个 

  47. Gromski, P. S.、Henson, A. B.、Granda, J. M. 和 Cronin, L. 如何使用算法和自动化探索化学空间。纳特。化学牧师。 3,119–128 (2019)。

    文章一个 谷歌学术一个 

  48. Attique, M.、Farooq, M. S.、Khelifi, A. 和 Abid, A. 使用机器学习预测治疗肽:计算模型、数据集和特征编码。IEEE接入 8,148570 - 148594 (2020)。

    文章一个 谷歌学术一个 

  49. Scott, G. G.、Börner, T.、Leser, M. E.、Wooster, T. J. 和 Tuttle, T. 四肽乳化剂的直接发现。正面。化学。 10,822868(2022)。

  50. Heydari, S.、Raniolo, S.、Livi, L. 和 Limongelli, V. 通过机器学习在分子系统之间转移化学和能量知识。交流。化学。 6,13(2023)。

    文章一个 谷歌学术一个 

  51. Kaygisiz,K.等人。来自连续蛋白质载体嵌入的病毒感染性增强肽原纤维的逆向设计。生物材料。科学。 11,5251–5261 (2023)。

  52. Deo,D.R.等人。通过循环神经网络实现大脑对双手运动的控制。科学。代表。 14,1598(2024)。

    文章一个 谷歌学术一个 

  53. Singh, S. H.、van Breugel, F.、Rao, R. P. 和 Brunton, B. W. 跟踪气味羽流的人工智能体中的突发行为和神经动力学。纳特。马赫。英特尔。 5,58–70 (2023)。

    文章一个 谷歌学术一个 

  54. Hong, T. & Stauffer, W. R. 计算复杂性推动了持续的深思熟虑。纳特。神经科学。 26,850–857 (2023)。

  55. Bengio, Y.、Simard, P. 和 Frasconi, P. 通过梯度下降学习长期依赖关系很困难。IEEE 传输。神经网络。 5,157–166 (1994)。

    文章一个 谷歌学术一个 

  56. Yang, G., Jiayu, Y., Dongdong, X., Zelin, G. & Hai, H. 用于中文长文本分类的特征增强文本初始模型。科学。代表。 13,2087(2023)。

    文章一个 谷歌学术一个 

  57. 张 L.、王 S. 和刘 B. 用于情感分析的深度学习:一项调查。WIRE 数据挖掘知识。迪可夫。 8,e1253(2018)。

    文章一个 谷歌学术一个 

  58. 张,X.等人。Deeptap:一种基于 RNN 的 TAP 结合肽预测方法,用于选择肿瘤新抗原。计算。生物。医学。 164,107247(2023)。

    文章一个 谷歌学术一个 

  59. Zhou, Z., Qiu, C. 和Zhang, Y. 使用软传感器模型预测空气臭氧的线性回归、神经网络和随机森林回归的比较分析。科学。代表。 13,22420(2023)。

    文章一个 谷歌学术一个 

  60. De Groot, N.、Pallares, I.、Avilés, F.、Vendrell, J. 和 Ventura, S. 疾病相关多肽聚集“热点”的预测。BMC 结构。生物。 5,18(2005)。

    文章一个 谷歌学术一个 

  61. Siri 团队。Hey Siri:设备上由 DNN 支持的语音触发器,适用于 Apple 个人助理。Apple 的机器学习研究 https://machinelearning.apple.com/research/hey-siri(2017)。

  62. Le, Q. V. 和 Schuster, M. 用于生产规模机器翻译的神经网络。谷歌人工智能博客 27(2016)。

  63. 苏涛,孙丽,王庆福。&王,D.-H。在深度学习:基础、理论和应用31-55(施普林格,2019)。

  64. 郭,C.等。通过芳香二肽和三肽共组装扩大纳米结构的多样性:纳米结构和分子机制。ACS纳米 10,8316–8324 (2016)。

    文章一个 谷歌学术一个 

  65. Reches, M. & Gazit, E. 通过芳香二肽自组装形成闭笼纳米结构。纳米快报。 4,581–585 (2004)。

    文章一个 谷歌学术一个 

  66. Conchillo-Solé,O. 等人。AGGRESCAN:用于预测多肽聚集“热点”的服务器。BMC 生物信息。 8,65(2007)。

    文章一个 谷歌学术一个 

  67. 李,S.等人。自组装肽及其在疾病治疗中的应用。国际。J.莫尔。科学。 20,5850(2019)。

  68. Lopez-Silva, T. L. 和 Schneider, J. P. 从结构到应用:肽材料开发的进展和机遇。电流。意见。化学。生物。 64,131–144 (2021)。

    文章一个 谷歌学术一个 

  69. Otoviä,E.,Njirjak,M.,Kalafatovic,D. 和 MauÅ¡a,G。基于循环神经网络的治疗肽预测的顺序属性表示方案。J.化学。信息。模型。 62,2961 年至 2972​​ 年(2022 年)。

    文章一个 谷歌学术一个 

  70. Singh, D. 和 Singh, B。调查数据标准化对分类性能的影响。应用。软计算。 97,105524(2020)。

    文章一个 谷歌学术一个 

  71. Nawi, N. M.、Atomi, W. H. 和 Rehman, M. Z. 数据预处理对人工神经网络优化训练的影响。过程。技术。 11,32-39 (2013)。

    文章一个 谷歌学术一个 

  72. Pascanu, R.、Mikolov, T. 和 Bengio, Y. 关于训练循环神经网络的困难。在过程。第30届国际机器学习会议1310–1318(PMLR,2013 年)。

  73. Van der Maaten, L. & Hinton, G. 使用可视化数据t-SNE。J·马赫。学习。资源。 9,2579–2605 (2008)。

  74. Wei, L., Ye, X., Sakurai, T., Mu, Z. & Wei, L. ToxIBTL:基于信息瓶颈和迁移学习的肽毒性预测。生物信息学 38,1514 年至 1524 年 (2022 年)。

    文章一个 谷歌学术一个 

  75. Dean, S. N.、Alvarez, J. A. E.、Zabetakis, D.、Walper, S. A. 和 Malanoski, A. P. PepVAE:用于抗菌肽生成和活性预测的变分自动编码器框架。正面。微生物。 12,725727(2021)。

    文章一个 谷歌学术一个 

  76. Negovetiä, M.、Otoviä, E.、Kalafatovic, D. 和 MauÅ¡a, G. 有效解决特征空间维数的问题以改进肽分类。数字发现。 3,1182 - 1193 (2024)。

  77. 卡佩基,A.等人。机器学习设计非溶血性抗菌肽。化学。科学。 12,9221–9232 (2021)。

    文章一个 谷歌学术一个 

  78. Elman, J. L. 及时发现结构。认知。科学。 14,179–211 (1990)。

    文章一个 谷歌学术一个 

  79. Hochreiter, S. 和 Schmidhuber, J. 长短期记忆。神经计算。 9,1735 年至 1780 年(1997 年)。

    文章一个 谷歌学术一个 

  80. Schuster, M. & Paliwal, K. K. 双向循环神经网络。IEEE 传输。信号处理。 45,2673–2681 (1997)。

    文章一个 谷歌学术一个 

  81. LeCun, Y.、Bengio, Y. 和 Hinton, G. 深度学习。自然 第521章,436–444 (2015)。

    文章一个 谷歌学术一个 

  82. 瓦斯瓦尼,A.等人。您所需要的就是关注。副词。神经信息。过程。系统。 30,5999–6010 (2017)。

    谷歌学术一个 

  83. 刘,Z.等人。通过顺序和图形编码有效预测肽自组装。简短的。生物信息学。 24,409(2023)。

    文章一个 谷歌学术一个 

  84. MauÅ¡a, G.、Njirjak, M.、Otoviä, E. 和 Kalafatovic, D. 基于可配置软计算的生成模型:催化肽的搜索。夫人高级。 8,1068–1074 (2023)。

  85. Needleman, S. B. & Wunsch, C. D. 适用于搜索两种蛋白质氨基酸序列相似性的通用方法。J.莫尔。生物。 48,443–453 (1970)。

    文章一个 谷歌学术一个 

  86. Thapa, S.、Clark, F.、Schneebeli, S. 和 Li, J. 发现自组装寡肽的多尺度模拟:一项基准研究。J.化学。理论计算。 20,375–384 (2023)。

  87. Biancalana,M.,Makabe,K.,Koide,A. & Koide,S. 硫磺素-T 与富含 β 的肽自组装表面结合的分子机制。J.莫尔。生物。 第385章,1052–1063 (2009)。

    文章一个 谷歌学术一个 

  88. Li,T.,Lu,X.-M.,Zhang,M.-R.,Hu,K.&Li,Z。基于肽的纳米材料:自组装,性能和应用。生物行动。马特。 11,268–282 (2022)。

    谷歌学术一个 

  89. 戈什,G.等人。控制肽自组装中的多个纳米和二级结构。安吉乌。化学。国际。埃德。 61,202113403(2022)。

    文章一个 谷歌学术一个 

  90. 胡 X. 等人。短肽自组装的最新进展:从合理设计到新颖应用。电流。意见。胶体界面科学。 45,1-13 (2020)。

    文章一个 谷歌学术一个 

  91. Ioffe, S. & Szegedy, C. 批量归一化:通过减少内部协变量偏移来加速深度网络训练。在国际机器学习会议448–456(PMLR,2015)。

  92. Srivastava, N.、Hinton, G.、Krizhevsky, A.、Sutskever, I. 和 Salakhutdinov, R. Dropout:防止神经网络过度拟合的简单方法。J·马赫。学习。资源。 15,1929 年至 1958 年(2014 年)。

    数学科学网一个 谷歌学术一个 

  93. 德容,D.H.等人。改进了马提尼粗粒蛋白质力场的参数。J.化学。理论计算。 9,687–697 (2013)。

    文章一个 谷歌学术一个 

  94. Yesylevskyy, S. O., Schäfer, L. V., Sengupta, D. & Marrink, S. J. 粗粒马丁尼力场的极化水模型。公共科学图书馆计算。生物。 6,e1000810 (2010)。

    文章一个 谷歌学术一个 

  95. Hünenberger, P. H. 在用于分子动力学模拟的恒温器算法(Holm, C. 和 Kremer, K. 编辑)105–149(Springer,2005 年)。

  96. Eisenhaber, F.、Lijnzaad, P.、Argos, P.、Sander, C. 和 Scharf, M。双立方晶格方法:表面积和体积数值积分以及分子组装体点表面轮廓的有效方法。J. 计算机。化学。 16,273–284 (1995)。

    文章一个 谷歌学术一个 

  97. Sievers, F. 和 Higgins, D. G. Clustal omega。电流。协议。生物信息。 48,1.25.1-1.25.33 (2014)。

    文章一个 谷歌学术一个 

  98. 马德拉,F.等人。2022 年 EMBL-EBI 提供搜索和序列分析工具服务。核酸研究。 50,276–279 (2022)。

    文章一个 谷歌学术一个 

  99. Waterhouse, A. M.、Procter, J. B.、Martin, D. M. A.、Clamp, M. 和 Barton, G. J. Jalview 版本 2 – 多序列比对编辑器和分析工作台。生物信息学 25,1189-1191 (2009)。

    文章一个 谷歌学术一个 

  100. 克鲁克斯,G.E.,Hon,G.,钱多尼亚,J.-M。& Brenner, S. E. WebLogo:序列徽标生成器。基因组研究。 14,1188-1190 (2004)。

    文章一个 谷歌学术一个 

  101. Njirjak,M.等人。ML 肽自组装。泽诺多 https://doi.org/10.5281/zenodo.13847868(2024)。

下载参考资料

关于《通过混合深度学习引导的生成式人工智能重塑自组装肽的发现》的评论


暂无评论

发表评论

摘要

提供的文本似乎是研究论文或技术报告的片段,讨论用于预测肽自组装和特性的机器学习方法。根据内容总结如下:### 要点:1. **肽自组装预测**:- 该研究的重点是开发机器学习模型来预测肽如何自组装成各种结构。- 采用各种技术,包括顺序编码(例如氨基酸序列)和图形表示(例如残基相互作用)。2. **使用的机器学习模型**:- 应用长短期记忆 (LSTM)、双向 RNN 和 Transformer 等不同的神经网络架构来捕获肽序列中的复杂模式。- 使用dropout、批量归一化等技术进行正则化和提高模型性能。3. **基于软计算的生成模型**:- 使用软计算技术(可能涉及模糊逻辑或进化算法)创建可配置的生成模型,以搜索具有特定属性的催化肽。4. **引用文献**:- 参考文献包括有关神经网络、Transformer 架构等深度学习框架以及 Needleman-Wunsch 等序列比对方法的开创性著作。- 还引用了针对基于肽的纳米材料及其自组装机制的研究。### 主要贡献:- 该研究旨在开发强大的预测模型,以了解肽如何通过自组装形成复杂的结构。- 它集成了多种计算方法(序列分析、机器学习、软计算),以提高材料科学和生物技术中的预测准确性和适用性。### 未来的工作和影响:- 该研究提出了设计新型肽基纳米材料的潜在应用,该材料具有适合各种生物医学和工业用途的定制特性。- 对这些模型的进一步探索可以帮助药物输送系统、生物材料制造和在分子水平上理解疾病机制。### 结论:这项研究强调了预测肽自组装模式的计算方法的进步。此类预测可以指导开发具有特定性能和应用的功能性肽基材料的实验设计。---该摘要抓住了利用先进机器学习技术来理解和预测肽组装行为的本质,​​这对于推进纳米材料设计和生物技术至关重要。参考

相关讨论