韩越兴 - 个人网站

2026 2025 2024 2023 2022 2021 2020 2019

2026年06月

恭喜马唯一顺利毕业！

马唯一，本科毕业于山东理工大学，于2023年开始在上海大学计算机工程与科学学院攻读专业型硕士研究生，加入课题组后，跟随杨风雷、韩越兴和陈侨川老师研究计算机视觉方向，在老师们的悉心指导下，完成了以下研究：

针对田间植物叶片病害检测中多尺度特征表达薄弱、层级融合语义持续衰减的问题，提出HRAGNet检测算法，设计交互式增强模块实现跨层级特征双向递归强化，搭配跨尺度语义对齐模块修正特征空间错位，并通过全局上下文聚合融合模块整合多尺度全局信息，有效提升复杂场景下不同尺寸病斑的特征判别能力。
针对HRAGNet解码阶段缺乏病斑空间先验、分类与回归任务特征耦合冲突的缺陷，提出改进算法HRAGNet+，构建几何-任务协同增强解码器。设计几何先验增强注意力模块显式建模病斑间空间分布关系；搭建任务特征解耦与融合模块，自适应拆分分类、回归专属特征，缓解多任务优化干扰，显著提升微小、密集病斑的定位与分类精度。
选取PlantDoc、TLD、FD多套公开农业视觉数据集开展对比实验与消融实验，通过多组定量指标、可视化样本、极端光照鲁棒性测试验证两套模型的综合性能，充分证明多尺度特征增强与几何任务协同优化机制在叶片病害检测任务中的有效性与泛化能力。
毕业后马唯一同学进入北京字节跳动，从事产品运营工作。在上海大学读研期间，马唯一同学踏实钻研、精进不止，持续提升专业水平与科研能力，并有幸与众多良师益友同行，收获颇丰。愿她在未来的征程中始终心怀理想、脚踏实地，不畏艰难、勇敢前行。

论文链接：基于多尺度特征增强与融合的植物叶片病害检测方法研究

代码链接：https://github.com/han-yuexing/2026-thesis-mwy-code

2026年6月阅读

恭喜沈新宇顺利毕业！

沈新宇，本科毕业于上海师范大学，于2023年开始在上海大学计算机工程与科学学院攻读学术型硕士研究生研究生，加入课题组后，跟随孙妍，韩越兴和陈侨川老师研究计算机视觉与智慧农业交叉方向，聚焦复杂农田场景杂草目标检测研究。在老师们的悉心指导下，完成了以下研究：

针对现有杂草检测方法在复杂农田场景下特征表征能力弱、易受背景干扰的问题，提出了一种双域融合Transformer检测模型FS-DETR。该模型通过空间域与频域双域注意力联合建模方式，有效增强农田图像细粒度特征表达，精准区分外观相似的作物与杂草目标，同时结合约束引导的标签分配策略优化样本匹配机制，大幅提升了复杂田间场景下的检测精度与训练稳定性。
针对现有Transformer检测算法解码建模单一、密集遮挡场景预测不稳定的问题，提出了解码增强版FS-DETR-D模型。该方法引入动态查询分配与超边高阶查询交互机制，自适应适配农田疏密、遮挡不一的复杂场景，精准建模密集杂草目标的空间结构关系。同时设计自适应感知损失函数动态调整监督强度，有效解决了传统方法漏检、误检、预测波动大的痛点，显著提升模型解码过程的稳定性与预测一致性。
针对现有农田视觉检测算法场景适配性差、通用泛化能力不足的局限性，构建了双域融合、解码增强的完整杂草检测算法体系。在WeedCrop、LincolnBeet、MH-Weed16等多个公开数据集上的大量实验证明，该体系相较于主流检测方法具备更优的精度与鲁棒性，解码增强模型相较基线模型实现稳定精度提升，有效适配各类真实复杂农田作业场景，完善了智慧农业视觉检测方案。

毕业后沈新宇同学进入荣耀终端有限公司，从事软件开发与技术研发工作。在上海大学读研期间，沈新宇同学踏实钻研、精进不止，持续提升专业水平与科研能力，并有幸与众多良师益友同行，收获颇丰。愿他在未来的征程中始终心怀理想、脚踏实地，不畏艰难、勇敢前行。

论文链接：基于Transformer的复杂农田杂草检测方法研究

代码链接：https://github.com/han-yuexing/2026-thesis-sxy-code

2026年6月阅读

恭喜李睿杰顺利毕业！

李睿杰，本科毕业于上海大学，于2023年9月开始在上海大学计算机工程与科学学院攻读硕士研究生，加入课题组后，跟随韩越兴老师学习形状空间理论和特征增强等相关技术与应用。在韩老师的悉心指导下，完成了以下研究：

针对已有测地线特征增强方法迭代搜索式优化效果不佳、效率低下的挑战，提出一种基于形状空间理论的自适应测地线特征增强方法。该方法克服了传统欧氏空间线性插值难以刻画特征非线性几何结构的瓶颈，旨在生成高质量特征。其核心流程为：首先将样本深度特征投影至预形状空间，并拟合自适应测地线以进行非线性特征增强；接着，重新设计融合样本相似性损失与分布差异损失的联合损失函数以约束测地线形态；最终，以梯度下降替代大量点采样与测地距离计算完成优化。实验证明，相较于现有方法，本方法在 CIFAR-10@5 等少样本数据集上显著提升了增强样本质量与下游分类准确率，有效降低了运行时间与能耗，展示了其在数据受限任务中的潜力。
针对单样本等极端场景下样本不足、测地线难以拟合的挑战，提出一种可扩展的测地线特征增强框架。该框架旨在将自适应测地线特征增强方法推广至从单样本到大规模数据的不同场景，兼顾计算效率与增强性能。具体而言，该框架将图像增强驱动的特征扩充引入预形状空间特征增强流程，以缓解极端场景下的特征稀缺，并结合小批次梯度下降处理大规模数据，利用基于样本来源的加权机制平衡原始特征与扩充特征的贡献。实验表明，该框架能在无需重新训练骨干网络的情况下，实现多尺度特征增强，并在生成增强特征时，相较于对比方法，能够更好地维持原始样本的分布结构与判别能力。

毕业后，李睿杰同学将进入 EA CHINA。回首在上海大学的三年，他学习努力，科研认真，专业能力持续精进，也与众多良师益友结下了深厚的情谊。希望李睿杰同学带着这份收获与历练，在未来的道路上不忘初心，砥砺前行，乘风破浪，前程似锦。

论文链接：基于形状空间理论的特征增强方法研究

代码链接：https://github.com/han-yuexing/2026-thesis-lrj-code

2026年6月阅读

恭喜徐天洋顺利毕业！

徐天洋，本科毕业于常州大学，于2023年开始在上海大学计算机工程与科学学院攻读学术型硕士研究生，加入课题组后，跟随韩越兴、陈侨川和孙妍老师研究微小目标检测方向，在老师们的悉心指导下，完成了以下研究：

提出了一种基于隐式特征融合与混合自适应标签分配的高精度目标检测方法。针对特征融合中的细节丢失问题，隐式特征融合利用隐式神经表示将多尺度特征映射至统一分辨率进行融合，有效保留了微小目标的精细特征。针对微小目标正样本质量与数量难以兼顾的缺陷，混合自适应标签分配策略结合 IoU 与感受野距离构建混合度量得分，并利用自适应机制精准挖掘高质量正样本。
提出了一种基于选择稀疏编码器与尺度感知 Query 选择的实时目标检测方法。针对基于 Transformer 的检测架构处理高分辨率特征图计算开销过大的问题，选择稀疏编码器利用特征选择机制与线性自注意力，大幅降低了显存占用与计算复杂度。为了解决微小目标特征在 Query 筛选阶段的置信度劣势，尺度感知 Query 选择机制通过引入基于特征下采样步长的折损系数，动态提升了模型对微小目标的关注度。

在上海大学读研期间，徐天洋同学踏实钻研、精进不止，持续提升专业水平与科研能力，并有幸与众多良师益友同行，收获颇丰。愿他在未来的征程中始终心怀理想、脚踏实地，不畏艰难、勇敢前行。

论文链接：面向微小目标的实时目标检测方法研究

代码链接：https://github.com/han-yuexing/2026-thesis-xty-code

2026年6月阅读

恭喜李子铭顺利毕业！

李子铭，本科毕业于山东建筑大学，于2023年开始在上海大学计算机工程与科学学院攻读硕士研究生，加入课题组后，跟随张瑞老师、韩越兴老师、陈侨川老师以及孙妍老师研究图像处理与计算机视觉方向。在老师们的悉心指导下，完成了以下研究：

针对医学影像场景中形状信息学习不足、局部纹理刻画与全局结构建模难以协同以及复杂边界区域判别增强等任务需求，提出了一种基于一致性约束与对比学习的涂鸦监督分割方法。该方法构建了由不同架构组成的异构双分支网络，以增强局部纹理刻画与全局结构建模之间的互补性。进一步结合网络扰动与输入扰动的一致性学习机制，生成更稳定的像素级伪标签。最后，以前景原型为锚点进行像素级原型对比校准，从而增强复杂边界区域的特征判别能力。
针对材料显微图像场景中极小样本条件下的训练稳定性、伪标签可靠性以及复杂相界附近的边界噪声控制等任务需求，提出了一种基于多历史投票与边界感知约束的涂鸦监督分割方法。该方法结合预训练初始化、浅层冻结和深层微调的迁移学习策略，以提高极小样本条件下的训练稳定性。同时，通过按样本维护的历史预测队列，综合多历史投票与置信度估计筛选可靠伪标签，从时间维度提升伪监督的稳定性。进一步地，在网络优化过程中联合引入边界平滑与边界锐化约束，增强模型对复杂相界的刻画能力。

在上海大学读研期间，李子铭同学踏实钻研、精进不止，持续提升专业水平与科研能力，并有幸与众多良师益友同行，收获颇丰。愿其在未来的征程中始终心怀理想、脚踏实地，不畏艰难、勇敢前行。

论文链接：基于涂鸦标注的弱监督复杂纹理图像分割方法研究

代码链接：https://github.com/han-yuexing/2026-thesis-lzm-code

2026年6月阅读

恭喜葛嘉浩顺利毕业！

葛嘉浩，本科毕业于上海大学，于2023年开始在上海大学计算机工程与科学学院攻读学术型硕士研究生。加入课题组后，跟随韩越兴老师学习研究小样本图像处理以及多任务学习相关技术与在农业上的应用，在韩老师的悉心指导下，完成了以下研究：

针对小样本条件下多任务特征干扰和回归分类难以协同的问题，提出基于多任务学习的果蔬多属性联合评估框架。该方法包括预分类路由、任务分支建模、特征增强与跨分支交互、联合损失优化。为支撑该方法训练与评估，进一步构建 FruVegSet 多属性对齐数据集，基于重量、曲直度与成熟度测量结果并结合等级映射规则，实现图像、连续属性与等级标签的一一对应。在当前数据规模与实验协议下，对比单任务模型和其他多任务模型，该方法在黄瓜和香蕉数据上取得较好的综合表现，尤其在任务平衡与等级判别方面表现稳定。
针对小样本条件下连续属性的端点样本之间过渡状态缺失的问题，在多任务联合评估框架基础上进一步提出基于中间样本生成的多任务扩展学习方法。该方法通过 DiffMorpher 生成中间过渡样本，结合 SAM2 分割模型、主体掩膜筛选策略与分任务伪标签构建提升补充监督质量。在该策略作用下，该方法在关键表型特征回归与等级分类任务中取得稳定提升，并一定程度改善三项任务的整体表现。

在上海大学研究生学习期间，葛嘉浩同学努力学习并提升专业水平与科研能力，结实了许多良师益友。希望葛嘉浩同学在未来的道路上心怀理想，不畏艰难勇敢前行。

论文链接：面向农业果蔬多属性联合评估的小样本多任务学习方法研究

代码链接：https://github.com/han-yuexing/2026-thesis-gjh-code

2026年6月阅读

恭喜黄志怡顺利毕业！

黄志怡，本科毕业于首都师范大学，于2023年开始在上海大学计算机工程与科学学院攻读学术型硕士研究生，加入课题组后，跟随韩越兴、陈侨川等老师研究农业目标检测相关技术与应用，在老师们的悉心指导下，完成了以下研究：

针对复杂农业场景下现有模型对多尺度、遮挡和密集果实定位与检测困难问题，提出了基于协同注意力与层级自蒸馏的农业果实目标检测方法，通过多尺度特征融合重加权模块、协同注意力解码器与层级自蒸馏策略，有效提升了复杂场景下多尺度、遮挡及重叠目标的定位鲁棒性。实验结果表明，该方法在复杂环境下的检测精度和稳定性均优于现有方法，为果实自动化生产与采收提供了有效解决方案。
针对农业果实成熟度检测中特征多样性与模型自适应能力不足的问题，设计了基于动态稀疏混合专家机制的农业果实目标检测方法，引入高频细节增强模块、动态稀疏混合专家解码器以及负载均衡与专家多样性损失函数，在保障专家多样性的同时，增强了模型对复杂光照和环境变化的自适应能力。实验结果表明，该方法能够有效提升对不同成熟度状态果实的精准识别能力。

毕业后黄志怡同学加入中芯国际。黄志怡同学在上海大学三年的硕士学习期间刻苦钻研，积极投身科研工作。面对困难，始终保持乐观的心态和顽强的意志力，展现出扎实的独立研究功底与敏锐的创新思维。愿黄志怡同学在未来的征途上永葆初心，无惧风浪，笃行致远。

论文链接：基于自蒸馏与混合专家机制的农业果实目标检测方法研究

代码链接：https://github.com/han-yuexing/2026-thesis-hzy-code

2026年6月阅读

团队近期成果--高强度低合金钢微观组织的自动分割与识别

我们团队在 Materials（中科院三区，JCR Q2）上发表论文 “Automatic Segmentation and Recognition of the Microstructure of High-Strength Low-Alloy Steel”。该论文围绕高强低合金钢显微组织的自动分割与识别展开研究。

金相显微组织分析对于揭示钢在热处理和机械加工过程中的组织演化规律具有重要意义。然而，光学显微图像中普遍存在晶界模糊、晶粒内部灰度不均以及晶粒形貌不规则等问题，这给显微组织的精准分析带来了挑战。为了解决上述问题，本文提出了一种基于超像素的自动化金相图像处理方法——DPSS（Dual-Phase Steel Segmentation），重点实现显微组织的高质量分割与后续识别。

具体而言，DPSS首先通过边缘检测与图像锐化增强图像对比度和晶界可见性；随后，将超像素分割与提取的边缘信息相结合，以提升边界定位精度并保留不规则晶粒形貌，从而实现对光学显微图像中晶粒或颗粒区域更加完整的提取。本文在 Mn-Si 低合金钢光学显微图像上进行了验证，实验结果表明，与传统基于 ImageJ（Version 1.54f）的处理方法相比，DPSS 能够获得更加准确、完整的显微组织分割结果。在此基础上，本文进一步引入轻量化神经网络进行相组织识别，最终分类识别准确率达到 99.91%。该结果表明，改进后的分割方法能够为后续显微组织识别提供更加可靠的输入。总体而言，本文提出的方法为金相图像分割提供了一种高效、自动化的解决方案，并为下游相组织分析提供了有力支持。

论文链接：Automatic Segmentation and Recognition of the Microstructure of High-Strength Low-Alloy Steel

王璐

2026年6月阅读

2026年05月

团队近期成果--面向复杂农业场景的双域融合Transformer杂草检测框架

我们团队在《Knowledge-Based Systems》(IF: 7.6, 中科院一区Top)上发表论文“Tiny object detection via implicit feature fusion and hybrid metric adaptive label assignment”。该论文上海大学计算机工程与科学学院为第一单位。

微小目标检测（Tiny Object Detection, TOD）在农业场景中有广泛应用。微小目标检测的像素极其有限，这限制了特征的提取、融合并对主流检测方法的标签分配策略提出了挑战。为了应对这些问题，本文提出了一种基于隐式特征融合（Implicit Feature Fusion, IFF）和混合自适应标签分配（Hybrid Adaptive Label Assignment, HALA）的微小目标检测网络，命名为IHANet，旨在实现高精度的微小目标检测。

具体而言，IFF通过利用隐式神经表示，缓解了多尺度融合中的特征不对齐问题，将来自不同金字塔层级的特征图映射为统一尺寸后进行融合。通过将特征图建模为连续表示，IFF能够在任意分辨率下实现有效融合，保留微小目标的细节并减少信息损失。HALA通过结合交并比（IoU）和在微小目标检测中表现更为优越的感受野距离（Receptive Field Distance, RFD），并采用自适应选择策略挖掘高质量训练样本，优化了标签分配过程，从而提升模型的训练和检测性能。在 AI-TOD、SODA-D、VisDrone 和 AgriPest 数据集上进行的广泛实验表明，IHANet 在多个 TOD 场景中均实现了先进的性能，其中在 AI-TOD 数据集上的 AP 值达到 29.1。

论文链接：Tiny object detection via implicit feature fusion and hybrid metric adaptive label assignment

代码链接：https://github.com/han-yuexing/IHANet

徐天洋

2026年5月阅读

祝贺阮礼恒获得2025年度上海市计算机学会优秀硕士学位论文提名奖

姓名：阮礼恒

单位：上海大学

论文题目：基于形状空间理论特征增强的小样本图像生成方法研究与应用

导师姓名：韩越兴

2026年5月阅读

2026年04月

团队近期成果--深度学习驱动的Mg-Gd合金显微组织表征和维氏硬度预测

我们团队在《Journal of Magnesium and Alloys》（中科院一区，JCR Q1）上发表论文“Deep learning-driven microstructure characterization and Vickers-hardness prediction of Mg-Gd alloys”。该论文以高强度 Mg-Gd 合金为研究对象，围绕合金“工艺—微观组织—性能”之间的定量关联建模问题，提出了一种基于图像识别与深度学习的多模态融合框架，实现了对 Mg-Gd 合金维氏硬度的自动化预测。

高强度 Mg-稀土（Mg-RE）合金中，固溶处理和时效处理会显著影响合金的微观组织与力学性能。然而，传统实验方法和物理建模方法仍难以有效建立加工参数、微观组织特征与性能响应之间的定量映射关系。针对这一问题，本文以高强度 Mg-Gd 合金为案例，构建了一个面向“工艺（固溶与时效）—微观组织—性能”的定量分析框架。具体而言，固溶态 Mg-Gd 合金的力学性能主要受 Gd 含量、晶界特征以及第二相存在情况影响；而时效态合金的性能则进一步受到 Gd 含量、时效参数以及析出相特征的共同影响。

为建立上述映射关系，本文提出了一种两阶段多模态融合框架，将元素成分、工艺参数与由合金显微图像提取的微观组织特征相结合，用于预测合金硬度。该框架首先利用深度学习方法从不同状态下的合金图像中自动提取晶粒尺寸、第二相和析出相等关键微观组织特征；随后，将这些图像特征与成分及加工参数进行融合，分别构建固溶态数据集和时效态数据集。其中，固溶态数据集用于预测固溶态硬度，时效态数据集则用于预测由时效处理引起的硬度增量。实验结果表明，两个预测模型分别取得了 0.90 和 0.89 的 R² 值，表现出较高的预测精度。

与人工分析结果的对比验证表明，本文提出的两阶段框架能够实现 Mg-Gd 合金最终室温硬度的自动化预测，有效降低人工微观组织分析成本。

论文链接：Deep learning-driven microstructure characterization and Vickers-hardness prediction of Mg-Gd alloys

代码链接：https://github.com/han-yuexing/MCVHPA

王璐

2026年4月阅读

2026年03月

团队近期成果--面向涂鸦标注医学图像分割的 FW2SS 框架

我们团队在《Neurocomputing》(IF: 6.5, 中科院二区)上发表论文 “Scribble consistency match and pixel-level prototype contrastive calibration for weakly supervised medical segmentation”。该论文以上海大学计算机工程与科学学院为第一单位，针对医学图像像素级标注成本高、涂鸦标注监督信息不足的问题，提出弱监督医学图像分割框架 FW2SS。

医学图像分割是医学图像分析中的重要任务，主要用于从 CT、MRI 等影像中准确分离器官、组织或病灶区域，可为疾病诊断、定量分析和临床治疗提供辅助支持。近年来，深度学习显著提升了分割性能，但其通常依赖大量精确的像素级标注，而医学图像标注成本高、专业性强，弱监督医学图像分割逐渐成为研究热点。 FW2SS 基于 CNN-Transformer 混合结构，结合 CNN 的局部细节建模能力和 Transformer 的全局结构感知能力。论文提出 Scribble Consistency Match 技术，通过网络扰动与输入扰动的一致性学习生成更可靠的密集伪标签，从稀疏涂鸦标注中学习完整形状信息；同时提出 Pixel-level Prototype Contrastive Calibration技术，利用高置信度像素构建类别原型，并通过对比学习增强类内一致性和类间区分性，从而提升边界和细节区域的分割效果。

在 ACDC 和 MSCMRseg 数据集上的实验表明，FW2SS 在涂鸦监督条件下取得了先进性能，平均 Dice 分别达到 90.0% 和 88.2%，显著优于多种现有弱监督医学图像分割方法。该研究在降低医学图像标注成本的同时提升了分割精度，为弱监督医学影像分析和临床智能辅助提供了有效技术方案。

论文链接：Scribble consistency match and pixel-level prototype contrastive calibration for weakly supervised medical segmentation

代码链接：https://github.com/han-yuexing/FW2SS

李子铭

2026年3月阅读

2026年02月

团队近期成果--面向农业应用综合评估的多任务学习框架

我们团队在《Information Sciences》(IF: 6.8，中科院二区)上发表论文“A multi-task learning framework for integrated assessment in agricultural applications”。该论文上海大学计算机工程与科学学院为第一单位。

水果和蔬菜的自动化评估是智慧农业、质量控制和供应链管理中的重要任务。传统人工称重和目视检查存在耗时、劳动成本高、主观性强等问题，现有自动化方法也多针对单一任务，难以在同一框架下完成多属性综合评估。此外果蔬多属性标注的数据集也较少。为了解决这一问题，本文提出了一种面向农业应用的多任务深度学习框架，能够从单张RGB图像中同时完成重量预测、关键表型特征分析和品质等级分类。

具体而言，本文构建了水果和蔬菜综合评估数据集FruVegSet（FVS），包含黄瓜和香蕉两类农产品，并提供图像、重量、关键表型特征和品质等级等多属性标注。在模型设计上，本文采用基于ResNet18的预分类模块识别农产品类别，并将输入图像路由至对应的类别专属子网络；随后通过重量分支和关键表型分支分别提取任务相关特征，引入特征金字塔网络增强形态特征表达，结合大核注意力融合模块和交叉注意力机制实现任务间信息交互，最终同时预测重量、关键表型特征分析和品质等级分类，完成综合评估。实验结果表明，所提出框架在黄瓜和香蕉数据上均取得了良好的综合评估效果，并优于单任务模型及代表性农业品质分类模型。

论文链接：A multi-task learning framework for integrated assessment in agricultural applications

葛嘉浩

2026年2月阅读

团队近期成果--面向复杂农业场景的双域融合Transformer杂草检测框架

我们团队在《Information Sciences》（IF：6.8，中科院二区TOP）上发表论文“A Dual-Domain Detection Transformer for Fine-Grained Weed Detection in Complex Agricultural Scenes”。该论文上海大学计算机工程与科学学院为第一单位。

杂草检测是精准农业、智能除草和智慧农田管理中的关键技术。然而，在复杂农业环境中，由于作物与杂草外观高度相似、目标遮挡严重、背景干扰复杂以及尺度变化显著等因素，现有检测方法容易出现误检和漏检，难以满足实际应用需求。针对上述问题，本文提出了一种双域融合检测Transformer框架FS-DETR（Frequency-Spatial Detection Transformer），通过协同建模空间域与频域信息，实现复杂农业场景下细粒度杂草目标的精准检测。

具体而言，本文提出了一种混合特征融合模块（Hybrid Feature Fusion，HFF），通过融合多尺度空间特征与频域高频信息，增强模型对细粒度纹理特征和边缘信息的表达能力，从而有效缓解杂草与作物重叠以及复杂背景干扰带来的检测困难。同时，设计了双域注意力机制（Dual Domain Attention Mechanism，DDAM），将频域注意力与可变形注意力进行自适应融合，在编码阶段充分挖掘空间结构信息与频域纹理信息，提高模型在复杂农业环境中的特征提取与目标辨识能力。进一步地，构建了基于高斯分布与约束引导的标签分配模块（Gaussian Distribution-based and Constraint-guided Label Assignment，GCLA），优化杂草与作物目标的标签匹配过程，提高训练阶段的监督质量和检测精度。

在WeedCrop、LincolnBeet和MH-Weed16三个公开农业杂草数据集上的实验结果表明，FS-DETR均取得了优异性能。其中，在WeedCrop、LincolnBeet和MH-Weed16数据集上分别获得47.2%、60.4%和32.5%的AP，相较基线模型分别提升1.4%、1.0%和0.6%。此外，在小目标杂草检测任务中，FS-DETR分别较当前次优方法提升1.2%和0.2%，展现出良好的细粒度目标检测能力和复杂场景鲁棒性，为智能农业中的精准杂草管理提供了新的技术方案。

论文链接：A Dual-Domain Detection Transformer for Fine-Grained Weed Detection in Complex Agricultural Scenes

代码链接：https://github.com/YanSun-github/FS-DETR

沈新宇

2026年2月阅读

2026年01月

团队近期成果--面向真实场景植物叶片病害诊断的端到端目标检测框架

我们团队在《Expert Systems with Applications》(IF: 7.5, 中科院一区)上发表论文“PDDNet: An End-to-End Object Detection Framework for Real-World Plant Leaf Disease Diagnosis”。该论文上海大学计算机工程与科学学院为第一单位。

植物叶片病害检测是智慧农业、精准植保与作物健康管理中的重要任务。然而，在真实农业场景中，叶片病斑通常受到复杂自然背景、多尺度病害区域、光照变化以及不同病害类别间视觉差异细微等因素影响，导致现有检测方法在定位精度、分类鲁棒性和跨场景泛化能力方面仍面临挑战。为解决这一问题，本文提出了一种端到端植物叶片病害检测框架 PDDNet，通过级联编码器-解码器结构融合局部病斑细节与全局上下文信息，从而提升模型在真实场景下的病害检测性能。

具体而言，我们提出了一种基于增强注意力的多尺度聚合模块（Enhanced Attention-based Multi-scale Aggregation，EAMA），通过空间注意力与通道注意力的协同建模，增强模型对不同尺度病斑区域的特征表达能力。同时，引入基于先验的自注意力机制（Prior-guided Self-Attention，PGSA），将位置先验与 IoU 几何关系融入注意力计算，使模型能够更加关注病斑边界与形态结构。进一步地，本文设计了多任务特征解耦模块（Multi-task Feature Decoupling Module，MFDM），通过任务特定的动态掩码分离分类特征与定位特征，缓解分类与回归任务之间的冲突。在 PlantDoc 和 Tomato Leaf Disease 等真实场景数据集上的实验结果表明，PDDNet 在复杂背景、多尺度病斑以及细粒度类别识别任务中均取得了良好的检测效果，为精准农业中的自动化病害诊断提供了可靠的技术支撑。

论文链接：PDDNet: An End-to-End Object Detection Framework for Real-World Plant Leaf Disease Diagnosis

马唯一

2026年1月阅读