诊断植物病害对于满足世界不断增长的粮食需求至关重要,预计到2050年,全球人口将达到91亿。病害可使作物产量减少20-40%,因此早期检测至关重要。传统的疾病识别方法包括专家分析和基于机器学习的图像处理。然而,手动方法效率低下且容易出错,而机器学习,特别是卷积神经网络(CNN)等深度学习方法,通过提取详细的图像特征彻底改变了疾病检测。

彻底改变植物病害诊断预训练模型优于传统方法

这些模型通常是在ImageNet等非植物数据集上进行预训练的,并且缺乏特定的植物病害领域知识,导致准确性有限。这一差距凸显了需要开发具有植物表型和疾病专业知识的预训练模型,以提高植物病害诊断的准确性。

2023年5月,PlantPhenomics发表了题为“PDDD-PreTrain:一系列常用的预训练模型支持基于图像的植物病害诊断”的研究文章。

在这项研究中,作者使用名为PDDD(植物病害诊断数据集)的综合数据集开发了一系列用于植物病害诊断的预训练模型,该数据集包含40个植物物种、120个病害类别的超过400,000张图像。探索了不同的模型结构和参数以适应不同的诊断场景和设备。为了进行评估,研究人员使用了分类识别精度和平均精度(mAP)等方法,并使用Kaggle植物病害数据集和PlantDoc等数据集进行测试。

结果表明,基于PDDD和PlantVillage数据集的预训练模型明显优于仅在ImageNet上训练的模型。这在植物病害分类等任务中表现得很明显,其中结合PlantVillage和ImageNet数据集的混合模型表现出色。在植物病害检测中,使用PDDD和ImageNet权重初始化的FasterR-CNN模型显示出更高的检测精度和泛化能力。

同样,在植物病害分割中,在PDDD和ImageNet上预训练的DeeplabV3模型取得了更高的准确率,凸显了将特定领域知识融入模型的优势。

总之,这些结果凸显了使用大规模、特定领域数据集进行植物病害诊断预训练的重要性。通过开源这些模型,作者旨在帮助该领域的进一步研究,并为先进、高效的植物病害诊断方法提供基础。这些模型的成功标志着深度学习在植物病害诊断中的应用迈出了重要一步,预示着在精准农业和其他相关领域的潜在应用。