日本語 English | 中文 |
网站首页 自我介绍 研究介绍 参与项目 教学介绍 其他内容 联系地图
2025.06 恭喜包胜奇顺利毕业!
包胜奇,本科毕业于上海大学,于2022年开始在上海大学计算机工程与科学学院攻读学术型硕士研究生。包胜奇同学自本科大四开始进入韩越兴研究组学习研究图像处理相关技术与应用,在韩老师的悉心指导下,延续并推进了以下研究:
1. 针对功能材料图像多层次特征复杂的问题,提出一种基于单模态特征解耦的轻量级深度学习方法,以解决钙钛矿PUF防伪标签真实性预测任务。特征解耦策略将宏观与微观特征的学习分离为独立阶段,减少了不同层级特征间的干扰。为满足高效率与低延迟需求,设计了轻量化分流卷积网络,其核心的分流卷积机制显著降低了计算复杂度。同时,采用额外角度边界损失函数,通过增大类间距离、减小类内差异,增强了特征的判别能力。为实现未知样本的有效拒绝,提出了测地度量方法,在高维流形空间根据测地距离对样本真实性进行预测。
2. 针对功能材料多模态异构数据特征难以融合的问题,提出了一种基于多模态特征融合的轻量级深度学习方法,以解决海藻酸钙/石墨烯复合材料性能预测任务。通过设计表格驱动特征融合网络,有效整合了图像与表格两种异构数据源。该网络包含两大核心模块:表格引导视觉语义增强模块和门控特征融合模块。表格引导视觉语义增强模块利用表格信息引导视觉特征学习,以实现深度跨模态对齐与增强;门控特征融合模块通过交叉注意力与门控机制,进行模态间的有效交互、对齐及自适应加权融合。同时,为确保计算效率,网络采用了分流卷积、Mamba等轻量化设计。
包胜奇同学在上海大学三年的研究生生涯中努力学习、认真科研,不断增强自己的专业知识,有幸结识了许多良师益友。希望包胜奇同学在未来的道路上不忘初心,牢记使命,披荆斩棘,砥砺前行。
论文链接:面向功能材料数据的特征处理与预测方法研究

2025.06 恭喜阮礼恒顺利毕业!
阮礼恒,本科毕业于上海大学,于2022年9月开始在上海大学计算机工程与科学学院攻读硕士研究生,加入课题组后,跟随韩越兴老师学习形状空间理论和图像生成等相关技术与应用。在韩老师的悉心指导下,完成了以下研究:
1. 针对图像生成模型在训练样本过少及缺乏适用预训练模型时面临的挑战,提出一种基于预形状空间测地曲面信息迁移的图像生成方法。该方法克服了模型难以有效学习极少样本分布的瓶颈,旨在生成高质量、多样化的图像。其核心流程为:首先提取少量样本的深度特征,并利用这些特征在预形状空间中构建测地曲面以进行非线性特征增强;接着,基于增强后的特征构建伪源域以模拟丰富的数据分布,并进行从伪源域到目标域的信息迁移;最终,在信息迁移阶段施加插值监督与正则化约束进行优化。实验证明,相较于现有方法,本方法在多领域数据集上显著提升了生成图像的质量、细节丰富度和多样性,有效缓解了模式坍塌,并展示了其生成图像在辅助下游任务中的潜力。
2. 针对文本引导的零样本图像风格迁移任务的挑战,提出一种基于预形状空间中测地曲面特征增强的零样本风格迁移方法。该方法旨在高效地将外部新颖风格信息注入预训练模型,同时确保风格一致性与内容准确性。具体而言,该方法将测地曲面特征增强思想应用于基于预训练扩散模型的风格迁移框架,结合滑动窗口裁剪处理局部信息,并利用测地曲面特征增强模块在预形状空间中促进风格与内容特征的有效融合。实验表明,该方法能在无需额外模型微调或风格参考的情况下,实现灵活的文本引导风格控制,并在生成具有目标风格的图像时,相较于对比模型,能够更好地维持原有的内容结构。
毕业后,阮礼恒同学将进入华为公司。回首在上海大学的三年,他学习努力,科研认真,专业能力持续精进,也与众多良师益友结下了深厚的情谊。希望阮礼恒同学带着这份收获与历练,在未来的道路上不忘初心,砥砺前行,乘风破浪,前程似锦。
论文链接:基于形状空间理论特征增强的小样本图像生成方法研究与应用
代码链接:https://github.com/P2i42/FAGStyle

2025.06 恭喜张一琳顺利毕业!
张一琳,本科毕业于黑龙江科技大学,于2022年开始在上海大学计算机工程与科学学院攻读专业型硕士研究生,加入课题组后,跟随张瑞、韩越兴和陈侨川老师研究材料文献信息挖掘方法,在老师们的悉心指导下,完成了以下研究:
1. 针对材料文献中存在的长序列依赖、实体关系复杂的问题,提出语义增强图网络模型,应用到复合材料的文献挖掘领域。该模型通过构建异构图强化语义关联建模,并引入分块注意力机制高效处理长序列问题,有效克服传统模型的局限性。 在此基础上,利用深度可分离卷积融合全局与局部语义特征,并结合动态边权重机制与深度评分网络提升节点表示与识别精度,更有效地捕捉材料术语在复杂上下文中的语义关系。
2. 针对通用材料文本中实体边界模糊、长实体识别效果不佳的问题,提出多粒度融合图网络模型,应用于材料科学文献领域的命名实体识别任务。该模型设计了融合多粒度语义特征与边界优化策略的新模块:首先,通过门控融合与跨粒度交互注意力,增强不同尺度语义特征的表示能力;其次,结合条件随机场与对比学习进行联合训练,利用它们各自的优势,协同提升边界识别的准确性和长实体识别的性能。
3. 将所提出的文献挖掘方法应用于碳纤维复合材料性能预测与应用设计。通过挖掘并筛选材料实验文献,提取出九类与力学性能密切相关的关键特征,通过实验验证了文献挖掘成果在性能建模中的应用潜力。此外,设计并实现了一个材料性能预测系统,支持用户上传数据文件并完成模型选择、训练与结果可视化,为材料研究人员提供了一个高效、易用的性能预测工具。
张一琳同学毕业后加入阿里巴巴集团,从事软件开发工作。在上海大学研究生期间,她努力学习,不断增强专业知识和研究能力,有幸结识了许多良师益友。希望张一琳同学在未来的道路上不忘初心,牢记使命,披荆斩棘,砥砺前行。
论文链接:基于语义感知的材料文献挖掘方法研究
代码链接:https://github.com/han-yuexing/2025-thesis-zyl-code

2025.06 恭喜王慧顺利毕业!
王慧,本科毕业于延边大学,于2022年9月开始在上海大学计算机工程与科学学院攻读硕士研究生,加入课题组后,跟随韩越兴老师学习自然语言处理等相关技术与应用并完成了以下研究:
1. 为了发挥大语言模型在科学文献场景下进行实体提取的潜力,提出了一种上下文一致的实体显式标注方法与双阶段训练方法,来解决大语言模型在生成式输出与命名实体识别任务序列标注特性之间的差异。然后,在训练阶段分为监督微调和直接偏好优化两个阶段,监督微调阶段先在已有标注数据上学习基本的实体识别能力;直接偏好优化阶段为了更有效地引导模型纠正错误,在负样本构造时尝试扩张、收缩实体边界,并对监督微调后的推理结果筛选制造类别混淆样本,通过利用正负样本对的偏好差进行约束,增强模型对错误判定的修正能力。
2. 为解决通用模型在处理材料科学、生物医学等高度专业化领域时,因大量低频专业术语导致命名实体识别精度不足的问题,本文提出了一种基于领域语言模型的语义融合方法,通过将不同领域语言模型和领域词级向量进行语义融合,来增强对科学文献的深层语义理解,通过实验验证了方法对材料科学和生物医学领域中复杂专业文本的有效性。最后将方法应用在具体领域,设计出了三种高硬度合金,展现其在科研文本挖掘及辅助研发决策方面的实用价值。
毕业后王慧同学进入维沃移动通信公司。王慧同学在上海大学三年的研究生生涯中努力学习,参与科研项目。对于复杂的问题,能够快速分析并提出有效的解决方案,展现了较强的独立研究能力和创新意识。希望王慧同学在未来的道路上不忘初心,披荆斩棘,砥砺前行。
论文链接:面向科学文献的命名实体识别研究与应用
代码链接:https://github.com/han-yuexing/2025-thesis-wh-code

2025.06 团队近期成果--基于形状空间理论的小样本图像处理投影模块
我们团队在国际期刊《Expert Systems With Applications》(IF:7.8,中科院一区Top)上发表论文 "A projection module based on the shape space theory for small-sample image processing"。该论文上海大学计算机工程与科学学院为第一单位,胡干为第一作者,韩越兴为通讯作者。
“预训练+微调”范式为有限数据集下的神经网络图像处理提供了有效工具。该方法通过在大型源数据集上预训练模型,弥补目标小数据集的信息不足。然而当目标数据集进一步缩减至小样本规模时,现有方法难以维持迁移模型的性能,导致效果急剧恶化。为克服此缺陷,本文提出基于形状空间理论的投影模块PMSS,以增强迁移模型在小样本场景下的能力。

我们首先在源数据集预训练模型并保存,随后利用预训练模型提取目标数据集特征。这些原本处于欧氏空间的特征通过PMSS投影至预形状空间进行后续训练。此外,在学习过程中引入类感知注意力机制,通过增强特征表征能力提升模型处理小样本任务的能力。在10种骨干网络和5个数据集上的大量实验证明了PMSS的有效性:在CIFAR10、CIFAR100及其小样本子集上分别实现了6%、8%和13%的精度提升。PMSS采用即插即用设计,无需改变网络架构即可直接应用于现实世界的有限数据系统。与最新流形学习方法及鲁棒迁移学习方法相比,PMSS在处理小样本任务上达到了最先进的性能水平。
论文链接:A projection module based on the shape space theory for small-sample image processing

2025.03 团队近期成果--利用深度学习高效设计多组分高硬度高熵合金的框架
我们团队在《ACS Applied Materials & Interfaces》(IF: 8.3, 中科院二区)上发表论文“Deep Learning-Based Framework for Efficient Design of Multicomponent High Hardness High Entropy Alloys”。该论文上海大学计算机工程与科学学院为第一单位,韩越兴为第一作者,王慧为第二作者,刘轶为通讯作者。
在材料科学领域,高熵合金(HEAs)因其优异的性能而成为研究热点。 然而,在广阔的合金成分空间中寻找兼具创新性和可靠性的最优设计面临巨大挑战。 传统试错法效率低下,而单纯的数据驱动方法又难以保证设计的实用性能。 针对这一问题,我们提出了一种基于深度学习的框架,该框架将材料领域知识与数据驱动技术相结合,以优化多组分高硬度高熵合金的设计过程。

首先,我们开发了一个材料级联嵌入(MCE)模块,并将其与BiLSTM-CRF网络集成(MCE-BILSTM-CRF),自动分析了过去5年中发表的2698篇论文,提取了8067个数据点。 通过将材料领域知识融入数据分析,我们识别了高潜力元素和关键工艺条件,以指导机器学习数据集的设计和构建。 经过手动总结和整理目标文献,我们构建了一个包含13种元素的硬度数据集。 在此基础上,我们利用遗传算法(GA)和粒子群优化(PSO)相结合的两阶段设计策略来开发多组分高熵合金。 第一阶段探索合金体系,第二阶段优化成分比例,从而促进创新和性能提升。 我们的分析结合了SHAP特征重要性和皮尔逊相关系数(PCC),并辅以材料领域知识,以验证研究结果并指导合金系统的选择。最后,我们成功设计了三种不同于现有数据集的高熵合金且预测的平均相对硬度误差低于5%,最优合金的硬度仅比历史记录低38 HV。
论文链接:Deep Learning-Based Framework for Efficient Design of Multicomponent High Hardness High Entropy Alloys

2025.01 团队近期成果--基于轻量级卷积神经网络的钙钛矿荧光防伪标签快速准确识别技术
我们团队在国际期刊《ACS Applied Materials & Interfaces》(IF:8.3,中科院二区)上发表论文“Fast and Accurate Recognition of Perovskite Fluorescent Anti-Counterfeiting Labels Based on Lightweight Convolutional Neural Networks”。该论文上海大学计算机工程与科学学院为第一单位,韩越兴为第一作者,包胜奇为第二作者,石博日为第三作者,陈侨川为通讯作者。

防伪技术一直是信息安全领域的关键问题。物理不可克隆函数(PUF)标签是由随机过程生成的随机图案,因其物理图案的固有随机性而成为一种有效的防伪策略。本研究开发了一种基于表面张力约束的高通量液滴阵列生成技术,用于制备具有可控形状和尺寸的钙钛矿晶体薄膜。通过利用钙钛矿纳米晶粒子的随机分布来构建PUF标签的纹理。与其他防伪标签相比,本研究的标签不仅具有荧光特性,还具有微米级尺寸、低成本和高编码容量,为多级防伪保护提供支持。此外,本研究引入了一种基于部分卷积网络(PaCoNet)的创新PUF识别方法,有效解决了之前方法在识别精度和速度方面的局限性。对包含多达60种不同宏观形状和独特微观纹理的钙钛矿纳米晶体薄膜数据集的实验验证表明,本研究的方法实现了高达99.65%的识别精度,并将每张图像的识别时间显著缩短至仅0.177秒,突显了这些标签在防伪领域的潜在应用。
论文链接:Fast and Accurate Recognition of Perovskite Fluorescent Anti-Counterfeiting Labels Based on Lightweight Convolutional Neural Networks

2025.01 团队近期成果--基于现场观测和视频处理的板条马氏体相变统计分析
我们团队在国际期刊《Physics of Metals and Metallography》上发表论文“Statistics and Analysis of Lath Martensite Transformation based on in-situ observation and video processing”。该论文上海大学计算机工程与科学学院为第一单位,韩越兴为第一作者,李睿祺为第二作者,徐翔宇为通讯作者。

材料科学的研究方法正随着人工智能和科学设备的发展迎来新变革。从传统基于静态图像研究材料性能的方式,到通过动态视频揭示材料微结构变化过程,这一转变不仅提升了研究的深度,也大幅提高了数据处理的效率。尤其在钢材制造领域,研究奥氏体向马氏体的相变对优化材料性能至关重要。
本文中我们提出了一种基于动态视频的板条马氏体相变分析方法,突破了静态图像研究的局限性。该方法能够高效分割和提取单个板条马氏体的图像数据,并在动态视频中分析其变化规律。通过统计包括转变板条数量、尺寸、面积和方向在内的多个关键属性,我们实现了对马氏体相变动态特性的全面解析。这一方法不仅提高了信息提取效率,还为深入揭示马氏体相变机制和优化钢材制造工艺提供了重要数据支撑。
研究结果表明,动态视频研究能够显著提高数据处理的效率和精度,尤其在面对板条马氏体复杂形态和快速转变过程时。未来,我希望将这一方法应用于更多材料体系的研究,进一步推动材料性能优化与工艺改进。

2025.01 团队近期成果--利用深度学习从文献中提取曲线图信息的方法
我们团队在《International Journal of Machine Learning and Cybernetics》(IF: 3.1, 中科院三区)上发表论文“Automatic pipeline for information of curve graphs in papers based on deep learning”。该论文上海大学计算机工程与科学学院为第一单位,韩越兴为第一作者,夏锦桦为第二作者,陈侨川为通讯作者。
在材料科学和生物医学领域。当前学术数据库工具主要集中在挖掘文本信息,而忽略了图表中所呈现的有价值的信息。从大量文献中提取信息可以帮助研究人员快速掌握当前的发展状态。文献是多种形式数据的载体,而大多数研究人员仅关注文本内容。尤其是像曲线图,包含了大量在其他数据中未表达的关键数值信息。本文提出了一种从文献中的曲线图提取信息的方法。通过该方法,可以从图形和文本中提取曲线图的数值和坐标轴实体。首先,使用Yolov5s从文献中剪切出曲线图。然后,通过操作Sentence-Bert来匹配与每个曲线图对应的准确标题文本。在获得标题文本后,使用SCI-Bert提取曲线图中的X轴和Y轴名称。同时,采用光学字符识别(OCR)等技术,自动解析图表上反映的数值数据。此外,还采用了一些原则来提高性能。我们使用来自Elsevier的6042篇文章的数据集验证了每个步骤。通过我们的方法,曲线图检测和标题匹配的准确率分别为96.4%和95.8%,均优于初始模型,证明了我们方法的有效性。实体和数值数据提取的准确率分别为76.3%和28.2%。实验结果表明,我们的方法能够实现从文献中大规模提取曲线图的知识。

论文链接:Automatic pipeline for information of curve graphs in papers based on deep learning

2024
2026
最后更新时间: 2025.7.5