玉米是一种重要的全球作物,需要准确的雄穗计数来进行产量估算和作物管理,传统上是手动或通过基本成像和机器学习技术完成的。

玉米产量估算MLAENet 方法可实现准确高效的雄穗计数

然而,由于环境干扰和手动计数的繁琐性,这些方法会出现问题。最近的进展利用基于深度学习的对象检测,特别是深度卷积神经网络(CNN)来提高准确性和效率。然而,这些方法难以应对玉米雄穗的可变规模和复杂的背景,导致检测效率低下。

当前的研究探索密度图估计方法来克服这些限制。这些方法提供了改进的空间分布可视化并减少了手动标记工作。尽管如此,如何有效地调整这些方法以适应不同的流苏尺寸、复杂的背景以及快速而准确的计数的需求仍然是一个挑战。

Plant Phenomics发表了一篇题为“用于在野外计数玉米穗的多尺度点监督网络”的研究文章。

该研究引入了一种称为多尺度精简注意力增强网络(MLAENet)的新颖方法,使用点级注释来计数玉米雄穗。该方法包含一个多列精简特征提取模块,该模块利用多个扩张卷积来生成与比例相关的密度图,以及一个多特征增强模块,该模块集成了用于区分流苏和复杂背景的注意策略。

此外,称为 UP-Block 的创新上采样模块旨在提高密度图的质量。MLAENet 的功效在两个公共数据集上得到了验证,显示出优于现有方法的计数准确性和推理速度。

实验设计涉及复杂的软件和硬件设置,包括 PyTorch、CUDA 和 NVIDIA GeForce RTX 3090Ti。采用高斯滤波来生成密度图,并根据玉米雄穗距离自适应确定传播参数。

模型训练采用训练集和验证集混合的 5 倍交叉验证,使用预训练的 VGG16 权重和高斯初始化。Adam 优化器用于针对每个数据集以特定学习率进行训练。

MAE、RMSE、R 2和 SMAPE等评估指标揭示了 MLAENet 的高精度和鲁棒性,特别是在不同规模的场景中。与 MCNN、CSRNet 和 MPS 等最先进方法的比较分析证明了 MLAENet 在密度图估计和计数精度方面的优越性。

即使在长距离拍摄或严重遮挡等具有挑战性的条件下,该模型也能有效地区分玉米雄穗和其他植物。在推理速度方面,MLAENet 显着优于其他网络,在标准分辨率图像上实现了 32.90 FPS 的惊人速度,同时保持了高精度。

该模型的设计(包括 LCB)确保了速度和精度之间的平衡,使其适合实时应用。消融研究强调了 NAM、UP-Block 和 LCB 等各种组件在增强模型性能方面的重要性。

总之,MLAENet 代表了玉米雄穗计数的突破,提供了高质量的密度图和跨不同场景的稳健性能。未来的改进可能涉及实施先进的特征提取方法以进一步提高网络效率。