番茄叶部病害的人工识别是一个耗时费力的过程,如果没有专业帮助,可能会导致结果不准确。因此,自动化、早期、精确的叶病识别系统对于农民通过及时采取干预措施减轻疾病传播来确保番茄生产的质量和数量至关重要。在这项研究中,我们提出了七个强大的贝叶斯优化深度混合学习模型,利用深度学习和机器学习之间的协同作用,对十种番茄叶子(九种患病和一种健康)进行自动分类。我们定制了流行的卷积神经网络(CNN)算法来自动特征提取,因为它能够直接从原始数据和经典机器学习技术[随机森林(RF)、XGBoost、GaussianNB(GNB)、支持向量中捕获特征的空间层次结构机器 (SVM)、多项式 Logistic 回归 (MLR)、K 最近邻 (KNN)] 以及用于分类的堆叠。此外,该研究还结合了 Boruta 特征过滤层来捕获统计上显着的特征。标准的、以研究为导向的 PlantVillage 数据集用于性能测试,这有助于对先前的研究进行基准测试,并能够对不同方法的分类性能进行有意义的比较。我们利用各种统计分类指标来证明我们模型的稳健性。使用CNN-Stacking模型,本研究在七种混合模型中实现了最高的分类性能。在一个看不见的数据集上,该模型的平均精度、召回率、f1 分数、mcc 和准确度值分别为 98.527%、98.533%、98.527%、98.525% 和 98.268%。我们的研究仅需要 0.174 秒的测试时间即可正确识别噪声、模糊和变换的图像。这表明我们的方法在具有挑战性的照明条件和复杂背景下捕获的图像中具有时间效率和通用性。根据比较分析,与现有研究相比,我们的方法更加优越且计算成本低廉。这项工作将有助于开发智能手机应用程序,为农民提供实时疾病诊断工具和管理策略。
番茄 (Solanum lycopersicum) 是一种商业营养食品作物,在农业经济中发挥着重要作用1。20192年,番茄产量占蔬菜总产量的16%。最新统计数据显示,全球番茄产量约为1.8亿吨,出口额88.1亿美元3。然而,由于容易受到一些传染性和非传染性因素的影响,番茄产量每年下降 810%4。这些因素的影响可能从轻微影响到更严重的影响,甚至更大程度地消灭整个作物。此外,植物病害还会影响生产的数量和质量,最终影响人类健康并造成经济损失和粮食不安全5,6。黄叶曲叶病毒、细菌性斑点病、花叶病毒、壳针孢叶斑病、叶霉病、晚疫病、白粉病和早疫病是最常见的番茄叶部病害7。这些叶部疾病对番茄作物产量造成严重损害,导致对害虫防治措施的大量投资,占总经济影响的很大一部分8。因此,番茄叶病检查和管理是农业实践中的重要组成部分,旨在减轻病害造成的作物产量损失。
农业中不加区别地过度使用农药,以此作为减轻病害和影响的手段。害虫,造成重大的经济、环境和健康风险。虽然其目的可能是保护农作物产量,但这种做法往往会导致一些有害的结果。因此,必须尽早准确识别病害,以最大程度地降低农药大量使用的风险,减少农作物损失,帮助农民有效识别病害植物并及时采取纠正措施,确保农作物的质量和数量。如果不及时识别和监测,这些疾病可能会变得更加严重并阻碍作物生产9。因此,早期准确地识别和分类番茄叶病有助于防止疾病在其他植物之间传播,减少产量损失并确保最佳生产。
植物病害的识别是植物病理学的一个重要方面,它通常是通过用肉眼仔细检查植物叶子病害的形态症状来完成的,依靠观察者辨别植物叶子的视觉线索和异常的能力。形态症状包括叶子颜色、纹理、形状和整体外观的明显变化,以及病变、斑点或其他独特图案的存在。分子、血清学和微生物学诊断技术是植物病理学领域诊断植物病害的其他标准方法10。实施目视检查方法需要不断的专家监控,这使得它非常昂贵且耗时。这在大型农场和偏远地区尤为明显,因为这些地区的交通便利性构成了重大挑战11。在大型农场,经营规模需要对人力资源进行大量投资,从而扩大了财务和时间方面的影响12。因此,研究人员越来越多地转向作物病害识别自动化系统,作为克服手动检查相关挑战的主动措施13,14。最近,机器学习 (ML) 在农作物病害识别和分类方面引起了广泛关注,类似于它在其他不同领域取得的巨大成功14,15,16。机器学习在农业中的一项值得注意的应用涉及在大型数据集中对不同水果和蔬菜进行准确分类17,以及预测大规模作物产量18。随着人工智能(AI)的快速发展,图像处理和不同图像的数据库有助于植物病害的轻松诊断和分类19,20。研究人员和农民利用在各种条件下捕获的植物叶子、茎或果实的数字图像来训练机器学习模型。支持向量机 (SVM)21、逻辑回归 22、朴素贝叶斯 Bayes23、K 最近邻 (KNN)、自适应提升 24、随机森林 (RF)25、人工神经网络 (ANN)26,27 是常用的传统计算机视觉 -用于自动化植物病害识别和分类的技术。除了机器学习模型外,深度学习(DL)方法,即卷积神经网络(CNN)28,29、循环神经网络(RNN)30、长短期记忆(LSTM)等也广泛用于植物病害分类和识别31,因为它们在处理顺序数据和捕获远程依赖性方面具有出色的性能,这是植物健康分析的关键方面。如今,AlexNet32、ResNet33 和 VGG34 等迁移学习方法在水果计数、农作物病害识别和分类方面也很流行,这大大减少了对大量计算资源的需求和模型构建周期35。深度学习方法还应用于多尺度农业传感,为全球农业界提供资源并推进精准农业36。在各种深度学习方法中,深度卷积神经网络 (CNN) 最广泛用于农作物病害检测、分类和分割37,38,39。CNN 从输入数据中自动学习分层表示的固有能力使其在处理复杂的视觉信息(例如受疾病影响的农作物的图像)时特别有效。CNN 擅长捕获图像中复杂的模式和特征,使它们能够辨别指示各种农作物病害的细微差异。这种能力对于准确的疾病检测和分类至关重要,有助于发展更具弹性的农业实践。此外,CNN 还可以促进图像分割,从而精确描绘作物内受影响的区域,有助于有针对性地进行疾病管理干预。
尽管疾病在番茄植株叶子上留下了一些明显的标记,但区分它们却具有挑战性由于受影响的树叶之间存在细微的差异。各种疾病可能会表现出不同的症状,例如变色、病变或枯萎,但外观上的相似之处甚至经常让经验丰富的园艺师感到困惑。疾病的复杂性在于其呈现的微妙模式和色调,这使得查明影响番茄植株的确切疾病成为一项艰巨的任务。这种复杂性强调了精确诊断和警惕监测对于实施有针对性的干预措施和保障番茄作物整体健康的重要性。现有文献揭示了为番茄叶病的早期检测和分类而设计的成熟模型的存在。这些模型代表了农业技术的重大进步,为农民和研究人员提供了宝贵的工具。然而,尽管它们做出了贡献,但某些限制阻碍了它们的有效性。一个值得注意的问题是这些模型可以准确识别的疾病类别数量有限,限制了它们对更广泛的潜在问题的适用性。此外,实现最佳概括和优化也存在挑战,这对于增强模型对不同环境条件和疾病变化的适应性至关重要。另一个关键方面是计算复杂性对这些模型整体鲁棒性的影响。随着农业系统的发展,解决这些限制变得势在必行,以确保这些技术解决方案保持有效并有助于可持续和有弹性的农业实践。在番茄叶病分类中探索新的特征提取技术、多模态数据融合、处理疾病变异性等方面,文献中存在潜在的研究空白。在这种情况下,增强机器学习模型在不同番茄叶病中的透明度、可解释性和泛化能力至关重要。此外,深度学习模型经常用于与图像处理和疾病分类相关的所有任务,这忽视了传统机器学习算法的潜力。深度学习模型需要大量数据和大量时间才能有效执行,这使得它更加昂贵和耗时。相比之下,机器学习可以在较小的训练数据下表现良好,从而使机器学习分类速度更快40。鉴于上述挑战,本研究提出了贝叶斯优化的深度混合学习模型,该模型旨在稳健、轻量且计算高效,用于番茄叶病的分类。所提出的新方法涉及优化七个混合模型,其中 CNN 用作特征提取器,并采用机器学习技术,例如 RF、XGBoost、高斯朴素贝叶斯 (GaussianNB)、SVM、多项式 Logistic 回归、KNN 和 Stacking 集成方法用于分类。我们的混合模型旨在充分利用深度学习和机器学习模型的独特特征,使模型具有良好的泛化性并具有较高的分类能力。通过与最先进的方法进行全面比较,这些混合模型的性能得到了广泛的验证。此外,该研究还集成了 Boruta 特征选择层,以辨别和过滤出疾病分类所必需的最相关特征。
贝叶斯优化在自动叶病检测中的应用,特别是在番茄叶的情况下,在最近的文献中得到了广泛的探讨。这种方法已应用于多种作物,包括水稻、玉米和一般植物。例如,Wang 等人41 采用基于注意力的神经网络与贝叶斯优化相结合来进行水稻病害检测和分类。同样,da Rocha 等人42 利用卷积神经网络 (CNN) 和超参数优化技术对玉米叶病进行分类。此外,Restrepo-Arias 等人43 提出了一种使用小型神经网络将图像纹理分析与贝叶斯优化相结合的植物病害检测策略。在这些研究的基础上,Seno 等人44 引入了一种新颖的贝叶斯卷积神经网络方法来诊断番茄叶病,有助于扩大自动化农业病害检测技术的范围。这些参考文献共同强调了贝叶斯优化方法在该领域的既定存在,表明其作为标准实践的集成。该研究的新颖之处在于,应用贝叶斯优化有助于提高数据效率和成本效益的农业过程。虽然贝叶斯优化以前可能已用于自动叶病检测,但我们的研究通过提供对其实施的全面见解而脱颖而出,包括参数调整、优化策略和针对番茄叶病检测的性能评估。因此,我们的研究通过创新地利用针对该领域的独特要求定制的贝叶斯优化技术,为自动番茄叶病检测的进步做出了重大贡献。此外,通过结合贝叶斯优化和深度学习机器学习对番茄叶病进行分类,我们的目标是增强农业运营的各个方面,从作物管理到病害检测和产量预测。它展示了如何将尖端技术整合到传统农业实践中,实现范式转变,使农民和消费者都受益。贝叶斯优化在超参数调整的背景下特别有价值,因为它利用概率模型来有效地探索超参数空间。这提高了深度神经网络和传统机器学习算法的性能,可有效对番茄叶病进行分类,从而减少大量手动参数调整的需要,并促进可持续农业实践。
论文的其余部分安排在
在文献综述部分,我们通过对现有文献和前沿研究的综合回顾,讨论了植物叶病检测的相关研究和进展。基于所获得的见解,我们在“方法论”部分提出了建议的混合方法。认识到问题的复杂性,我们制定了一种多方面的方法,结合了不同技术的优势,以提高植物叶片疾病检测的整体效率。本节阐述了我们建议的混合模型的概念框架、方法论和潜在优势。“结果和讨论”部分包含混合模型的结果及其与该领域现有研究的比较。“结论”部分提出了结论性意见,总结了本研究的主要发现和影响,从而符合纳入农作物病害识别自动化系统以应对粮食安全和可持续农业实践挑战的更广泛趋势。
在认识到人工智能在植物科学领域研究中的潜力后,基于机器学习和深度学习的技术成为对受感染植物或植物叶子区域进行分类的两类经过深入研究的方法。当前的文献。本节对自动疾病识别系统的一些最新和著名的研究进行了全面的调查。例如,Batool 等人1 使用迁移学习 (AlexNet) 技术从 450 张图像中提取特征,并使用传统的 ML (KNN) 对 9 种番茄叶病进行分类。作者1使用 60% 的数据进行训练和 40% 的数据进行测试,实现了 76.1% 的分类准确率。Basavaiah 提出了一种使用不同特征提取器技术的机器学习方法,即 Hu 矩(形状特征)、haralick(纹理特征)、颜色直方图(颜色特征)和局部二值模式(LBP)