韩越兴 - 个人网站

2025 2024 2023 2022 2021 2020 2019

2025年10月

2025年度新入生、蔡冬梅、龔明興、何翔、孔源、李争灏、唐梓萌、王宇迪、姚彩紅、周雯のグループ加入を歓迎します！

蔡冬梅、女性。西安工業大学コンピュータ科学・工学部データ科学・ビッグデータ技術専攻で学士号を取得。現在は上海大学コンピュータ科学・技術専攻の修士課程に在籍。趣味が広く、性格は熱心で大らかで、前向きである。今後の学習期間において「収穫を問うな、耕すことを問え」という人生の格言を実践し、皆と助け合いながら共に成長していきたい。

龔明興、男性。浙江工業大学コンピュータ科学技術学院・ソフトウェア学院にてソフトウェア工学専攻を卒業。現在は上海大学コンピュータ学院の修士課程に在籍。積極的で楽観的、責任感が強く、普段はバドミントンやサッカーを楽しみ、時にはランニングでリラックスする。大学院では専門能力と研究水準を高め、皆と共に成長していきたい。

何翔、男性。中北大学コンピュータ科学技術学部卒業。現在、上海第二工業大学電子情報学専攻にて専門職修士課程に在籍中。性格は積極的で楽観的、明るく社交的。趣味は多岐にわたり、旅行を好む。大学院在学中に自身の能力を高め、皆と共に成長しながら学んでいきたいと考えている。

孔源、男性。華北電力大学コンピュータ科学技術学部卒業。現在、上海大学コンピュータ科学技術専攻にて修士課程に在籍中。性格は積極的で楽観的。趣味はランニング、音楽鑑賞、ゲームなど。大学院在学中に共に学び努力できる良き友人に出会い、今後の生活において学業と生活のバランスを取りながら、努力を重ね能力を高め、共に成長していきたいと考えている。

李争灏、男性。安陽学院コンピュータ・数学学部IoT工学専攻卒業。現在、上海第二工業大学電子情報学専攻修士課程在籍。物静かで落ち着いた性格、良好なメンタルを持ち、周囲の人間関係構築に長ける。学習意欲が高く、強い向上心を持ち、仕事には真摯かつ責任感を持って取り組む。チームワークを重視し、明るく楽観的で前向きな性格。困難にも耐え忍ぶことができる。

唐梓萌、長春工業大学コンピュータ科学・工学院情報セキュリティ専攻を卒業後、現在上海大学コンピュータ学院にて修士課程に在籍中。明るく前向きな性格で、普段は写真撮影や司会進行を趣味としている。大学院では研究能力と協調性を高めると同時に、健康的な生活習慣を身につけ、研究室の仲間と共に成長していきたいと考えている。

王宇迪、男性。浙江工業大学で学士号を取得後、現在上海大学でコンピュータ科学技術専攻の修士課程に在籍中。様々なスポーツを好むが、バスケットボールとサッカーは得意ではない。誠実で熱心な人柄で、今後志を同じくする仲間と出会い、共に研究能力を高め、共に成長していきたいと考えている。

姚彩紅、女性。太原科技大学コンピュータ科学技術学院知能科学技術専攻を卒業後、現在上海大学コンピュータ学院コンピュータ科学技術専攻にて修士課程に在籍中。積極的で楽観的な性格、情緒が安定しており、人当たりが良く、異なる意見や考えに耳を傾けることを好む。大学院での学びを通じて専門能力を向上させ、皆と共に学び、共に成長していきたいと考えている。

周雯、女性。江西師範大学コンピュータ情報工学院コンピュータ科学技術専攻卒業。現在、上海大学にてコンピュータ科学技術専攻の修士課程に在籍中。性格は活発で明るい時もあれば、冷静で内向的な時もあり、時々抽象的なことを考えるのが好き。普段は卓球、ランニング、ゲームを楽しむ。大学院生活を通じて皆と共に成長し、志を同じくする友人を得られることを願っている。

2025年10月読む

チームの最近の成果：協調的注意と自己蒸留に基づく複雑環境下における農業目標検出フレームワーク

私たちのチームは『Information Sciences』（インパクトファクター：6.8、中国科学院QSCIランクII）に論文「Agricultural object detection in complex environments via co-attention and self-knowledge distillation」を発表しました。本論文は上海大学コンピュータ工学・科学学院を筆頭機関とし。

農業対象物検出は、スマート農業や自動収穫などの応用における中核タスクである。しかし、複雑な環境下では、照明の変化、背景干渉、果実の遮蔽などの要因により、検出精度が低下することが多い。この問題を解決するため、本論文では協調注意（Co-Attention）と自己蒸留（Self-Distillation）を組み合わせた効率的な検出フレームワークを提案し、複雑なシナリオにおける農業対象物検出の精度とリアルタイム性能を効果的に向上させた。

具体的には、マルチスケール特徴融合再重み付けモジュール（Multi-scale Feature Fusion Re-weighting Module, MS-FFRM）を提案し、マルチスケール特徴融合能力を強化することで、異なるサイズの果実に対する検出精度を向上させた。同時に、協調注意デコーダー（Co-Attention Decoder）を導入し、クロスアテンションと自己アテンションの利点を組み合わせることで、ターゲットクエリの相互作用方式を最適化し、モデルが遮蔽や重なり合うターゲットをより適切に処理できるようにした。さらに、階層的自己蒸留（Hierarchical Self-Distillation）メカニズムを構築し、デコーダ内部の異なる層間での知識伝達を実現することで、空間認識と位置特定における頑健性を向上させた。4つの果実成熟度検出データセットにおける実験により、本手法の有効性が実証された：トマトデータセットで75.4%の精度を達成、実環境トマトデータセットで52.7%、イチゴデータセットで41.5%、FruitRipenessデータセットで87.1%を達成した。

論文リンク：Agricultural object detection in complex environments via co-attention and self-knowledge distillation

黄志怡

2025年10月読む

2025年08月

チームの最近の成果：プリシェイプ空間における測地曲面情報に基づく転移学習による小標本画像生成

私たちのチームは国際学術誌『Pattern Recognition』（インパクトファクター：8.6、中国科学院Q1トップジャーナル）に論文「Few-shot Image Generation via Information Transfer from the Built Geodesic Surface」を発表しました。本論文の筆頭所属機関は上海大学コンピュータ工学・科学学院です。

生成対抗ネットワーク（GAN）や拡散モデルなどの現代人工知能モデルは、高度にリアルな画像を生成できるものの、その性能は数万枚の画像を含む大規模データセットでの訓練に大きく依存している。この「ビッグデータ」への依存は、多くの専門分野において顕著な「ボトルネック」となっている。なぜなら、これらの分野では大規模なデータ収集がコスト高で時間がかかり、非現実的だからである。データ不足の状況下では、既存モデルはしばしば機能不全に陥り、ぼやけた画像や重複した画像を生成する、いわゆる「パターン崩壊」の罠に陥る。

この難題を解決するため、我々のチームは「構築された測地曲面空間における情報転移（Information Transfer from the Built Geodesic Surface, ITBGS）」という新たなフレームワークを提案した。この手法は事前学習モデルに依存せず、極少数のサンプルから豊かで深層的な構造情報を抽出する知的なアプローチを採用しています。本フレームワークは画像特徴を高次元プリシェイプ空間に投影し、測地曲面を構築してサンプリングを行うことで、大規模データセットを模擬する多様で合理的な擬似特徴を生成します。これらの拡張された情報は画像生成器の訓練に活用され、実際の大規模データセットに触れることなく複雑なデータ分布パターンを学習させます。

チームの研究成果は複数の極めて挑戦的なデータセットで検証済みであり、実験結果からITBGSフレームワークが生成画像の品質・詳細豊かさ・多様性を顕著に向上させ、パターン崩壊問題を効果的に緩和できることが示されている。

論文リンク：Few-shot Image Generation via Information Transfer from the Built Geodesic Surface

コードリンク：https://github.com/han-yuexing/ITBGS

阮礼恒

2025年8月読む

2025年07月

チームの最近の成果：プリシェイプ空間における測地曲面強化に基づくゼロサンプルテキスト誘導画像スタイル転移

私たちのチームは国際学術誌『VISUAL COMPUTER』（インパクトファクター：2.9、中国科学院インパクトファクターランク3区）に論文「Geodesic feature augmentation for zero-shot text-guided diffusion style transfer」を発表しました。本論文は上海大学コンピュータ工学・科学学院を筆頭著機関としています。

画像スタイル転移は、ある画像の内容を別の芸術的スタイルと融合させることを目的としていますが、長年にわたり多くの課題に直面してきました。従来の手法は特定の「スタイル参照画像」に依存するケースが多く、ユーザーの創造性を大きく制限する上、適切な参照画像の探索には多大な時間と労力を要します。近年台頭したテキストガイド手法はより柔軟性を備える一方、核心的な課題に直面しています。それは、新たなスタイルを注入する際に、元の画像の核心的な内容や構造が破壊・歪曲されることをいかに回避するか、すなわち「内容とスタイルのバランス」の問題です。

この課題に対処するため、我々のチームはゼロサンプルテキストガイド型拡散画像スタイル転移手法「FAGStyle」を提案する。本手法は形状空間理論の概念を先進的な拡散生成モデルに革新的に応用したものである。スライディングウィンドウクロッピング技術と測地線曲面上の特徴強化技術をスタイル制御損失関数に統合することで、画像ブロック間の情報相互作用を強化する。さらに、内容の一貫性を確保するため、事前形成自己相関整合性損失関数を統合した。

多数の定性的・定量的実験結果から、多様な抽象的複合スタイルに対して、FAGStyle手法は従来のスタイル転移手法が抱える参照画像への依存性や内容保持の不足を克服し、スタイル強度、忠実度、内容忠実度のいずれにおいても現行主流手法を上回ることが示された。

論文リンク：Geodesic feature augmentation for zero-shot text-guided diffusion style transfer

コードリンク：https://github.com/han-yuexing/FAGStyle

阮礼恒

2025年7月読む

2025年06月

凌晨帆、ご卒業おめでとうございます！

凌晨帆さんは、武漢生物工程学院で学士課程を修了し、2022年より上海大学計算機工学与科学学院にて学術型修士課程に在籍しました。研究室に加入してからは、張瑞教授・韓越興教授・陳侨川教授のご指導のもと、自然言語処理の分野で研究を行い、以下の成果を収めました。

既存の固有表現抽出（NER）手法において長スパン表現に十分な意味情報が不足しているという問題に対して、偶数畳み込みに基づくスパン表現強化モジュールを提案しました。本モジュールはエンティティスパン内部の意味情報を効果的に捉え、長スパンの特徴表現を強化し、長スパン認識の性能を向上させました。

既存の対比学習に基づくNERフレームワークが単一の対比次元に限定されるという制約に対して、スパンとカテゴリの二重対比学習目標を導入しました。スパン次元のみを最適化する方法と比較して、エンティティカテゴリの識別性に優れた表現を学習することができました。さらに、カテゴリ側では事前学習済み言語モデルの代わりに軽量な学習可能埋め込み層を採用し、性能を維持しつつモデルの効率を向上させました。

情報抽出手法においてサブタスク間の相互作用が不十分であるという限界に対して、知識移転手法を提案しました。これは、対比学習に基づくNERモデルのパラメータを関係抽出モデルへ移転することを目的としています。具体的には、NER段階で訓練されたテキストエンコーダを再利用することで、エンティティの文脈情報をより効果的に符号化できるようにしました。また、カテゴリエンコーダの移転に基づくカテゴリ認識融合モジュールを導入し、関係抽出段階におけるエンティティカテゴリの認識能力を強化しました。これら二つの移転メカニズムの協働により、エンティティ関係抽出の性能が向上しました。

卒業後、凌晨帆さんは順豊科技有限公司に入社し、ソフトウェア開発の仕事に従事します。上海大学での大学院生活において、彼は着実に研究を進め、専門的知識と研究能力を絶えず高め、また多くの優れた師や友人に恵まれ、豊かな経験を得ました。これからの道のりにおいても、理想を胸に、地に足をつけ、困難を恐れず、勇敢に前進し続けることを願っています。

論文リンク：対比学習と知識移転に基づく情報抽出手法の研究

コードリンク：https://github.com/han-yuexing/2025-thesis-lcf-code

2025年6月読む

バオ・シェンチー、卒業おめでとう！

バオ・シェンチーは、上海大学で学士号を取得し、2022年から上海大学のコンピュータ工学と科学学院で学術型修士課程を開始しました。バオ・シェンチーは学部4年生の時から韓越興研究室に参加し、画像処理に関連する技術と応用を研究してきました。韓先生の丁寧な指導の下、以下の研究を継続し、発展させました：

機能性材料画像に含まれる多階層特徴の複雑性に鑑みて、方解石PUF偽造防止ラベルの真贋を予測する課題を解決するために、単峰性特徴デカップリングに基づく軽量深層学習法を提案する。特徴デカップリング戦略は、巨視的特徴と微視的特徴の学習を独立した段階に分離し、特徴の異なる層間の干渉を低減する。高効率と低遅延の要求を満たすために、軽量な発散畳み込みネットワークが設計され、そのコアとなる発散畳み込みメカニズムが計算複雑度を大幅に低減する。同時に、クラス間距離を増加させ、クラス内差を減少させることで、特徴量の識別能力を高めるために、余分な角度境界損失関数を用いる。未知サンプルの効果的な棄却を達成するために、高次元多様体空間における測地線距離に基づいてサンプルの真偽を予測する測地線メトリックを提案する。
機能性材料のマルチモーダルな異種データ特徴の融合が困難であるという問題に着目し、アルギン酸カルシウム/グラフェン複合材料の特性を予測するという課題を解決するために、マルチモーダル特徴融合に基づく軽量なディープラーニング手法を提案する。テーブル駆動型の特徴融合ネットワークを設計することにより、画像とテーブルという2つの異種データソースが効果的に統合される。このネットワークには2つのコアモジュールが含まれる：フォーム誘導型視覚的意味強調モジュールとゲート型特徴融合モジュールである。テーブル誘導型視覚的意味強調モジュールは、テーブル情報を用いて、深いクロスモーダルアライメントと強調のための視覚的特徴学習を誘導し、ゲーテッド特徴融合モジュールは、クロスアテンションとゲーティングメカニズムにより、効果的なモーダル間相互作用、アライメント、適応的重み付け融合を実行する。一方、計算効率を確保するために、ネットワークはシャント畳み込みやマンバなどの軽量設計を採用している。

バオ・シェンチーは、上海大学での3年間の大学院生活の中で、努力して学び、真剣に研究を行い、専門知識を高め、多くの良き友人やメンターに恵まれました。バオ・シェンチーが今後の道のりで初心を忘れず、使命を胸に刻み、困難を乗り越え、前進し続けることを願っています。

論文リンク：機能材料データの特徴処理と予測方法に関する研究

2025年6月読む

グエン・レ・ヘンさん、ご卒業おめでとうございます！

グエン・レ・ヘンは、上海大学で学士号を取得し、2022年9月から上海大学のコンピュータ工学と科学学院で修士課程を開始しました。研究グループに参加した後、韓越興先生の指導の下、形状空間理論や画像生成に関する技術と応用を学びました。韓先生の丁寧な指導の下、以下の研究を行いました：

画像生成モデルがトレーニングサンプルが不足している場合や適切な事前トレーニングモデルがない場合に直面する課題に対処するために、事前形状空間の測地曲面情報転送に基づく画像生成方法を提案します。この方法は、モデルが非常に少ないサンプル分布を効果的に学習するのが難しいというボトルネックを克服し、高品質で多様な画像を生成することを目的としています。そのコアプロセスは次のとおりです。まず、少数のサンプルの深層特徴を抽出し、これらの特徴を使用して事前形状空間に測地曲面を構築し、非線形特徴強化を行います。次に、強化された特徴に基づいて擬似ソースドメインを構築し、豊富なデータ分布をシミュレートし、擬似ソースドメインからターゲットドメインへの情報転送を行います。最終的に、情報転送段階で補間監視と正則化制約を適用して最適化します。実験により、既存の方法と比較して、この方法は多領域データセットで生成画像の品質、詳細の豊かさ、および多様性を大幅に向上させ、モード崩壊を効果的に緩和し、生成画像が下流タスクを支援する可能性を示しました。
テキスト誘導型ゼロショット画像スタイル転送タスクの課題に対処するために、事前形状空間における測地曲面特徴強化に基づくゼロショットスタイル転送方法を提案します。この方法は、外部の新しいスタイル情報を事前トレーニングモデルに効率的に注入し、スタイルの一貫性とコンテンツの正確性を確保することを目的としています。具体的には、この方法は測地曲面特徴強化の考え方を事前トレーニング拡散モデルに基づくスタイル転送フレームワークに適用し、スライディングウィンドウクロッピングを組み合わせて局所情報を処理し、測地曲面特徴強化モジュールを利用して事前形状空間におけるスタイルとコンテンツ特徴の効果的な融合を促進します。実験結果は、この方法が追加のモデル微調整やスタイル参照なしで柔軟なテキスト誘導スタイル制御を実現し、ターゲットスタイルの画像を生成する際に、対照モデルと比較して元のコンテンツ構造をより良く維持できることを示しています。

卒業後、グエン・レ・ヘンさんは華為技術有限公司に入社します。上海大学での3年間を振り返ると、彼は努力して学び、真剣に研究を行い、専門能力を高め、多くの良き友人やメンターに恵まれました。グエン・レ・ヘンさんが今後の道のりで初心を忘れず、使命を胸に刻み、困難を乗り越え、前進し続けることを願っています。

論文リンク：基于形状空间理论特征增强的小样本图像生成方法研究与应用

コードリンク：https://github.com/han-yuexing/FAGStyle

2025年6月読む

グエン・レ・ヘンさん、ご卒業おめでとうございます！

グエン・レ・ヘンは、黒竜江科技大学で学士号を取得し、2022年から上海大学のコンピュータ工学と科学学院で専門型修士課程を開始しました。研究グループに参加した後、張瑞、韓越興、陳侨川の各先生の指導の下、材料文献情報抽出方法の研究を行い、以下の研究を完了しました：

材料文献における長い系列依存性や複雑なエンティティ関係の問題に対処するために、意味強化グラフネットワークモデルを提案し、複合材料の文献発掘分野に適用しました。このモデルは、異種グラフを構築して意味的関連性のモデリングを強化し、ブロック注意メカニズムを導入して長い系列の問題を効率的に処理し、従来のモデルの限界を克服します。これに基づいて、深層可分離畳み込みを利用してグローバルおよびローカルな意味的特徴を融合し、動的エッジ重みメカニズムと深層スコアネットワークを組み合わせてノード表現と認識精度を向上させ、複雑な文脈における材料用語の意味的関係をより効果的に捉えます。
一般的な材料テキストにおけるエンティティ境界のあいまいさや長いエンティティ認識の効果が不十分な問題に対処するために、多粒度融合グラフネットワークモデルを提案し、材料科学文献分野の固有名詞認識タスクに適用しました。このモデルは、多粒度の意味的特徴と境界最適化戦略を融合させた新しいモジュールを設計しました。まず、ゲート融合とクロス粒度相互注意を通じて、異なるスケールの意味的特徴の表現能力を強化します。次に、条件付きランダムフィールドと対比学習を組み合わせて共同訓練を行い、それぞれの利点を活かして境界認識の精度と長いエンティティ認識の性能を協調的に向上させます。
提案された文献発掘方法をカーボンファイバー複合材料の性能予測と応用設計に適用しました。材料実験文献を発掘し、力学的性能に密接に関連する9つの重要な特徴を抽出し、実験を通じて文献発掘の成果が性能モデリングにおける応用の可能性を検証しました。さらに、ユーザーがデータファイルをアップロードし、モデル選択、訓練、結果の可視化を行うことをサポートする材料性能予測システムを設計・実装し、材料研究者に効率的で使いやすい性能予測ツールを提供しました。

グエン・レ・ヘンさんは卒業後、アリババグループに入社し、ソフトウェア開発に従事します。上海大学の大学院生として、彼は熱心に学び、専門知識と研究能力を高め、多くの良き師や友人に恵まれました。グエン・レ・ヘンさんが今後の道のりで初心を忘れず、使命を胸に刻み、困難を乗り越え、前進し続けることを願っています。

論文リンク：基于语义感知的材料文献挖掘方法研究

コードリンク：https://github.com/han-yuexing/2025-thesis-zyl-code

2025年6月読む

王輝、卒業おめでとう！

王輝、本科卒業は延辺大学、2022年9月から上海大学計算機工学部で修士課程を開始し、研究グループに参加後、韓越興教授の指導の下、自然言語処理などの関連技術と応用を学び、以下の研究を完了しました：

大規模言語モデルの科学文献におけるエンティティ抽出の可能性を引き出すために、文脈に一貫したエンティティの明示的なアノテーション手法と二段階のトレーニング手法を提案し、大規模言語モデルの生成的出力と命名エンティティ認識タスクの系列アノテーション特性の違いを解決します。次に、トレーニング段階は監視微調整と直接的な好みの最適化の2つの段階に分かれ、監視微調整段階では既存のアノテーションデータで基本的なエンティティ認識能力を学習します。直接的な好みの最適化段階では、モデルが誤りを修正するためのより効果的なガイダンスを提供するために、負のサンプル構築時にエンティティの境界を拡張および収縮し、監視微調整後の推論結果をフィルタリングしてカテゴリ混乱サンプルを生成します。正負サンプルペアの好みの差を利用して制約を強化し、モデルの誤判定修正能力を向上させます。
材料科学や生物医学のような高度に専門化された領域を汎用モデルで扱う場合、低頻度の専門用語が多く、名前付き実体の認識精度が不十分であるという問題を解決するために、本論文では、異なるドメイン言語モデルとドメイン単語レベルベクトルを意味的に融合することで、科学文献のより深い意味理解を強化するドメイン言語モデルに基づく意味融合手法を提案し、材料科学や生物医学分野の複雑な専門化されたテキストに対して、実験によりその有効性を検証する。本手法の有効性は、材料科学と生物医学分野の複雑な専門テキストに対して実験的に検証される。最後に、本手法を特定の分野に適用し、3種類の高硬度合金を設計することで、科学的テキストマイニングと研究開発の意思決定支援における実用的価値を示す。

卒業後、王輝さんは維沃モバイル通信会社に入社します。王輝さんは上海大学での3年間の大学院生活の中で、熱心に学び、研究プロジェクトに参加しました。複雑な問題に対して迅速に分析し、効果的な解決策を提案する能力を示し、独立した研究能力と革新意識を持っています。王輝さんが今後の道のりで初心を忘れず、困難を乗り越え、前進し続けることを願っています。

論文リンク：面向科学文献的命名实体识别研究与应用

コードリンク：https://github.com/han-yuexing/2025-thesis-wh-code

2025年6月読む

チームの最近の成果 - 形状空間理論に基づく小サンプル画像処理のための投影モジュール

我々のチームは、国際ジャーナル《Expert Systems With Applications》(IF:7.8、中科院一区Top)に論文 “A projection module based on the shape space theory for small-sample image processing”を発表しました。この論文は上海大学計算機工学部が第一著者となり。

“事前学習+微調整”のパラダイムは、限られたデータセットにおける神経ネットワークの画像処理に有効なツールを提供します。この方法は、大規模なソースデータセットでモデルを事前学習させることで、ターゲットの小さなデータセットの情報不足を補います。しかし、ターゲットデータセットがさらに小さなサンプルサイズに縮小されると、既存の方法は移行モデルの性能を維持するのが難しくなり、効果が急激に悪化します。この欠陥を克服するために、本論文では、形状空間理論に基づく投影モジュールPMSSを提案し、小さなサンプルシーンにおける移行モデルの能力を強化します。

我々はまず、ソースデータセットでモデルを事前学習し、保存します。次に、事前学習したモデルを使用してターゲットデータセットの特徴を抽出します。これらの元々ユークリッド空間にあった特徴は、PMSSを通じて予備形状空間に投影され、後続のトレーニングが行われます。さらに、学習プロセスにクラス認識注意メカニズムを導入し、特徴表現能力を強化することで、小さなサンプルタスクに対するモデルの処理能力を向上させます。10種類のバックボーンネットワークと5つのデータセットにおける大量の実験により、PMSSの有効性が証明されました。CIFAR10、CIFAR100およびその小サンプルサブセットでそれぞれ6%、8%および13%の精度向上を実現しました。PMSSはプラグアンドプレイ設計を採用しており、ネットワークアーキテクチャを変更することなく、現実世界の限られたデータシステムに直接適用できます。最新の多様体学習手法やロバスト転送学習手法と比較して、PMSSは小さなサンプルタスクの処理において最先端の性能を達成しました。

論文リンク：A projection module based on the shape space theory for small-sample image processing

コードリンク：https://github.com/hg18855467337-del/PMSS

胡干

2025年6月読む

2025年05月

チームの最近の成果 - 材料文献に基づく知識グラフを用いた繊維強化複合材料の引張強度性能予測

私たちのチームは国際学術誌『Polymer Composites』（インパクトファクター：4.7、中国科学院QSC-2）に論文「材料文献から構築したナレッジグラフに基づく繊維強化複合材料の引張強度性能予測」を発表しました。本論文は上海大学コンピュータ工学・科学学院を筆頭所属機関とし、陳僑川が筆頭著者、趙宸が第二著者、韓越興と宋娜が共同責任著者を務めています。

繊維強化ポリマー複合材料の引張強度予測は、本質的に「材料成分－成形プロセス－力学特性」の関係に対する正確な理解に依存する。しかし、複合材料の実験には長い期間と高いコストがかかるため、実験によって十分なデータを直接取得することはしばしば困難である。一方、関連文献が急速に蓄積していることから、文献マイニングと予測モデリングによって実験探索の一部を代替することが、実現可能なアプローチとなっている。

「データ入手困難、知識分散」というボトルネックを突破するため、当チームは文献データ抽出―知識グラフ構築―機械学習予測を融合した統合ソリューションを提案した：まず複合材料データセットComMatを体系的に整理・構築し、材料・プロセス・試験・性能などの重要要素を網羅する。次に、統合抽出モデルPFPMHNを用いて文献から構造化トリプルを抽出し、領域知識グラフを構築。逆引き検索と特徴量選別により、引張強度に強く関連する重要因子を特定した。

この基盤に基づき、我々は選抜した特徴量を予測モデルの訓練に活用し、引張強度の予測において高い精度を達成した。特徴量重要度分析、SHAP分析、OAT感度分析を組み合わせることで、引張強度に影響を与える主要変数をさらに特定・検証し、複合材料の配合設計とプロセス最適化に向けた実践的な意思決定の根拠を提供した。

論文リンク：The Prediction of Tensile Strength Performance of Fiber-Reinforced Composites Based on a Knowledge Graph Constructed From Material Literature

2025年5月読む

2025年03月

チームの最近の成果：深層学習に基づく多成分高硬度高エントロピー合金の効率的設計フレームワーク

私たちのチームは、論文 “Deep Learning-Based Framework for Efficient Design of Multicomponent 高硬度高エントロピー合金の効率的設計のためのディープラーニングに基づくフレームワーク」を発表した。上海大学コンピューター工学科が筆頭著者となり。

材料科学の分野では、高エントロピー合金（HEA）がその優れた特性から注目の研究テーマとなっている。しかし、膨大な合金組成の中から革新性と信頼性を兼ね備えた最適設計を見出すことは、大きな課題に直面している。従来の試行錯誤的な手法は非効率的であり、純粋にデータ駆動的な手法では設計の実用的な性能を保証することは困難である。この問題に対処するために、我々は、多成分、高硬度、高エントロピー合金の設計プロセスを最適化するために、材料ドメインの知識とデータ駆動技術を組み合わせたディープラーニングベースのフレームワークを提案する。

まず、Materials Cascade Embedding (MCE)モジュールを開発し、BiLSTM-CRFネットワーク(MCE-BILSTM-CRF)と統合して、過去5年間に発表された2,698の論文を自動的に分析し、8,067のデータポイントを抽出した。データ分析に材料分野の知識を取り入れることで、機械学習データセットの設計と構築の指針となる、可能性の高い要素と重要なプロセス条件を特定した。対象となる文献を手作業で要約・照合した後、13の要素を含む硬度データセットを構築した。これに基づいて、遺伝的アルゴリズム（GA）と粒子群最適化（PSO）を組み合わせた2段階の設計戦略を活用し、多成分の高エントロピー合金を開発した。第一段階では合金システムを探索し、第二段階では成分比率を最適化することで、技術革新と性能向上を促進する。我々の分析では、SHAP特徴の有意性とピアソン相関係数（PCC）を組み合わせ、材料分野の知識によって補完し、発見を検証して合金系の選択を導く。最終的に、既存のデータセットとは異なる3種類の高エントロピー合金の設計に成功し、平均相対硬度誤差を5%未満に予測することができました。

論文へのリンク: Deep Learning-Based Framework for Efficient Design of Multicomponent High Hardness High Entropy Alloys

コードリンク：https://github.com/han-yuexing/ED-MHEA

王慧

2025年3月読む

2025年01月

チームの最近の成果：軽量畳み込みニューラルネットワークに基づく方解石蛍光偽造防止ラベルの高速かつ正確な識別

論文「Fast and Accurate Recognition of Perovskite Fluorescent Anti-Counterfeiting Labels Based on Lightweight Convolutional Neural Networks」が国際学術誌ACS Applied Materials & Interfaces (IF:8.3, CAS Region II)に掲載されました。軽量畳み込みニューラルネットワークに基づく偽造ラベル」。この論文の筆頭著者は上海大学コンピューター工程科学学院。

偽造防止技術は、情報セキュリティ分野において常に重要な課題である。確率過程により生成されるランダムパターンであるPUF(Physical Unclonable Function)ラベルは、その物理パターン固有のランダム性により、偽造防止策として有効である。本研究では、表面張力制約に基づく高スループット液滴アレイ生成技術を、制御可能な形状とサイズを有するカルコゲナイド結晶膜の調製のために開発した。 PUFラベルのテクスチャーは、カルコゲナイドナノ結晶粒のランダムな分布を利用して構築される。他の偽造防止ラベルと比較して、本研究のラベルは蛍光特性を有するだけでなく、マイクロメートルサイズ、低コスト、高符号化能力を有し、多段階の偽造防止をサポートする。さらに、本研究では、部分畳み込みネットワーク（PaCoNet）に基づく革新的なPUF認識手法を導入し、認識精度と速度の面で従来の手法の限界に効果的に対処している。最大60種類の異なるマクロ形状とユニークなマイクロテクスチャを含むカルコサイトナノ結晶フィルムのデータセットを実験的に検証した結果、本研究の手法は最大99.65％の認識精度を達成し、画像1枚あたりの認識時間をわずか0.177秒に大幅に短縮することができ、偽造防止分野におけるこれらのタグの応用の可能性を浮き彫りにした。

論文へのリンク: Fast and Accurate Recognition of Perovskite Fluorescent Anti-Counterfeiting Labels Based on Lightweight Convolutional Neural Networks

包胜奇

2025年1月読む

チームの最近の成果：その場観察とビデオ処理に基づくスラットマルテンサイト相変態の統計解析

私たちのチームは、論文「その場観察に基づくラスマルテンサイト変態の統計と解析」を発表した。Statistics and Analysis of Lath Martensite Transformation based on in situ observation and video processing “という論文を発表した。筆頭著者は上海大学コンピューター工程科学学院。

材料科学における研究手法は、人工知能や科学機器の発達に伴い、新たな変革を遂げつつある。従来の静止画像に基づく材料特性の研究方法から、動的な動画によって材料の微細構造が変化する過程を明らかにする方法への転換は、研究の奥行きを深めただけでなく、データ処理の効率も飛躍的に向上させた。特に鉄鋼製造の分野では、オーステナイトからマルテンサイトへの相転移の研究は、材料特性を最適化するために極めて重要である。

本論文では、静的画像研究の限界を打破する、動的動画を用いたスラットマルテンサイトの相変態解析法を提案する。本手法は、個々のスラットマルテンサイトの画像データを効率的に分割・抽出し、その変化法則を動的動画で解析することができる。変形したスラットの数、大きさ、面積、方向を含むいくつかの重要な属性をカウントすることにより、マルテンサイト相変態の動的特性の包括的な分析を達成する。この方法は、情報抽出効率を向上させるだけでなく、マルテンサイト相変態メカニズムを明らかにし、鉄鋼製造プロセスを最適化するための重要なデータサポートを提供します。

この結果は、特にスラットマルテンサイトの複雑な形態と急速な変態過程に直面した場合、動的ビデオ研究がデータ処理の効率と精度を大幅に改善できることを示している。将来的には、この方法をより多くの材料系の研究に応用し、材料特性の最適化とプロセス改善をさらに推進したいと考えています。

李睿祺

2025年1月読む

チームの最近の成果：ディープラーニングを用いた文献からのグラフ情報抽出手法

私たちのチームは、論文「Automatic pipeline for information of curve graph in papers based on deep learning 」を発表した。自動パイプライン」を発表した。筆頭著者は上海大学計算機工程科学院。

材料科学や生物医学の分野である。現在の学術データベースツールは、主にテキスト情報のマイニングに重点を置いており、グラフやチャートに示された貴重な情報は無視されている。大量の文献から情報を抽出することで、研究者は開発の現状を迅速に把握することができる。文献は様々な形式のデータの担い手であり、ほとんどの研究者はテキストコンテンツにのみ注目している。特にグラフのように、他のデータでは表現されない重要な数値情報が多く含まれている。本稿では、文献中のグラフから情報を抽出する手法を提案する。この手法では、グラフとテキストの両方から、曲線グラフの数値と軸実体を抽出することができる。まず、Yolov5sを用いて文献から曲線グラフを切り出す。次に、Sentence-Bertを操作して、各曲線グラフに対応する正確なタイトルテキストを照合する。タイトルテキストを得た後、SCI-Bertを用いて曲線グラフのX軸とY軸の名前を抽出した。同時に、光学式文字認識（OCR）などの技術を使用して、グラフに反映された数値データを自動的に解析した。さらに、パフォーマンスを向上させるために多くの原則が用いられている。 Elsevierの6042の論文からなるデータセットを用いて、各ステップを検証した。本手法を用いた場合、グラフ検出の精度は96.4%、タイトルマッチングの精度は95.8%であり、いずれも初期モデルを上回り、本手法の有効性が証明された。エンティティの抽出精度は76.3%、数値データの抽出精度は28.2%であった。実験結果から、本手法が文献から曲線図の大規模な知識抽出を実現できることが示された。

論文へのリンク: Automatic pipeline for information of curve graphs in papers based on deep learning

夏锦桦

2025年1月読む