从图像数据中准确提取表型性状对于谷类作物研究至关重要,但由于穗和叶子之间的环境和物理相似性,温室中的穗检测具有挑战性。最近的努力包括提高图像分辨率和特征维度,以及开发 SpikeSegNet 等神经网络来改进尖峰检测。然而,这些方法很难准确定位小尖峰,并且需要神经网络调整和新颖的检测模型的进一步进步来有效克服这些尖峰检测挑战。

通过深度学习增强表型性状分析的温室穗检测进展

2024 年 1 月,Plant Phenomics 发表了一篇题为“利用基于深度学习模型的注意机制的温室栽培谷物作物的高通量尖峰检测”的研究文章。

在本研究中,实施并训练了三个深度神经网络(DNN)——FRCNN、FRCNN-A 和 Swin Transformer,用于谷类作物的穗检测。使用 SGD 优化器对网络进行优化,模型之间的训练时间有所不同;FRCNN 需要 900 到 1200 个 epoch,FRCNN-A 需要 800 到 1000 个 epoch,Swin Transformer 需要 2500 到 3000 个 epoch。使用动态学习率策略来优化模型收敛,证明了模型在检测不同难度的尖峰方面的有效性,特别是在密集的叶群中。

结果表明,在没有数据转换或增强的情况下,Swin Transformer 在准确性方面优于其他模型。增强了注意力模块的 FRCNN-A 模型比原始 FRCNN 有了显着改进,凸显了 FRCNN-A 架构进一步改进的潜力。注意力模块捕获感兴趣区域的分层上下文的能力因其在检测具有挑战性的尖峰模式方面的有效性而受到特别关注。

对来自两个表型分析设施的九个数据集进行的训练表明,随着训练集中原始图像内容的增加,所有模型的准确性都得到提高。Swin Transformer 在不同的训练集中表现出了最高的平均精度 (mAP),表明其提取特征和检测尖峰的卓越能力。然而,该研究还强调,虽然 Swin Transformer 提供了高精度,但 FRCNN-A 提供了更高效、更快速的训练替代方案,特别有利于具有相似特征的数据集。

结果强调了模型对增强图像的适应性及其在特定 IPK 测试集上的性能的重要性,突出了这些先进架构在改善混合小麦品种穗检测方面的潜力。该研究得出的结论是,修改后的 FRCNN-A 减少了卷积层数量并添加了注意力模块,再加上计算密集型 Swin Transformer,代表了复杂光学场景中小规模物体检测的重大进步。

这些创新有望提高表型分析任务的准确性和效率,尽管推理时间和准确性之间的权衡仍然是实时应用程序的考虑因素。