チームの最近の成果:複雑な農業シーンにおける二重ドメイン融合Transformer雑草検出フレームワーク
私たちのチームは『Information Sciences』(インパクトファクター:6.8、中国科学院QSCIランクII TOP)に論文「A Dual-Domain Detection Transformer for Fine-Grained Weed Detection in Complex Agricultural Scenes」を発表しました。本論文は上海大学コンピュータ工学・科学学院を筆頭機関とし。
雑草検出は、精密農業、スマート除草、スマート農地管理における重要な技術である。しかし、複雑な農業環境では、作物と雑草の外観が非常に類似していること、対象物の遮蔽が深刻であること、背景干渉が複雑であること、さらにスケール変化が大きいことなどの要因により、既存の検出手法では誤検出や見逃しが発生しやすく、実用上のニーズを満たすことが難しい。この問題を解決するため、本論文では、空間ドメインと周波数ドメインの情報を協調的にモデリングする二重ドメイン融合検出TransformerフレームワークFS-DETR(Frequency-Spatial Detection Transformer)を提案し、複雑な農業シーンにおける細粒度雑草対象の高精度検出を実現した。
具体的には、本論文では、マルチスケール空間特徴と周波数ドメインの高周波情報を融合する混合特徴融合モジュール(Hybrid Feature Fusion, HFF)を提案し、細粒度テクスチャ特徴とエッジ情報の表現能力を強化することで、雑草と作物の重なりや複雑な背景干渉による検出困難を効果的に緩和した。同時に、二重ドメイン注意機構(Dual Domain Attention Mechanism, DDAM)を設計し、周波数ドメイン注意と変形可能注意を適応的に融合することで、エンコード段階において空間構造情報と周波数ドメインのテクスチャ情報を十分に活用し、複雑な農業環境における特徴抽出能力と対象識別能力を向上させた。さらに、ガウス分布に基づく制約誘導型ラベル割り当てモジュール(Gaussian Distribution-based and Constraint-guided Label Assignment, GCLA)を構築し、雑草と作物対象のラベルマッチング過程を最適化することで、学習段階における教師信号の品質と検出精度を向上させた。
WeedCrop、LincolnBeet、MH-Weed16の3つの公開農業雑草データセットにおける実験結果により、FS-DETRは優れた性能を達成した。具体的には、WeedCrop、LincolnBeet、MH-Weed16データセットにおいて、それぞれ47.2%、60.4%、32.5%のAPを達成し、ベースラインモデルと比較してそれぞれ1.4%、1.0%、0.6%向上した。さらに、小型雑草対象の検出タスクにおいて、FS-DETRは現在の次善手法をそれぞれ1.2%および0.2%上回り、優れた細粒度対象検出能力と複雑シーンに対する頑健性を示した。これにより、スマート農業における精密雑草管理に新たな技術的解決策を提供した。
論文リンク:A Dual-Domain Detection Transformer for Fine-Grained Weed Detection in Complex Agricultural Scenes
コードリンク:https://github.com/YanSun-github/FS-DETR