团队近期成果--基于协同注意力和自蒸馏的复杂环境下农业目标检测框架
我们团队在《Information Sciences》(IF: 6.8, 中科院二区)上发表论文“Agricultural object detection in complex environments via co-attention and self-knowledge distillation”。该论文上海大学计算机工程与科学学院为第一单位。
农业目标检测是智慧农业与智能采摘等应用中的核心任务。然而,复杂环境下的光照变化、背景干扰与果实遮挡等因素常导致检测精度下降。为解决这一问题,本文提出了一种结合协同注意力(Co-Attention)与自蒸馏(Self-Distillation)的高效检测框架,有效提升了农业目标检测在复杂场景下的检测精度与实时性能。
具体而言,我们提出了一种多尺度特征融合重加权模块(Multi-scale Feature Fusion Re-weighting Module,MS-FFRM),通过加强多尺度特征融合能力,提高对不同尺寸果实的检测精度。同时,引入协同注意力解码器(Co-Attention Decoder),结合跨注意力和自注意力的优势,优化了目标查询的交互方式,使模型能够更好地处理遮挡和重叠目标。进一步地,我们构建了层级自蒸馏(Hierarchical Self-Distillation)机制,实现解码器内部不同层之间的知识传递,从而提高空间感知与定位鲁棒性。在四个果实成熟度检测数据集上的实验证明了本研究方法的有效性:在番茄数据集上准确率可达75.4%,在真实场景的番茄数据集可达52.7%,在草莓数据集可达41.5%,在FruitRipeness数据集可达87.1%。
黄志怡