グエン・レ・ヘンさん、ご卒業おめでとうございます!
グエン・レ・ヘンは、上海大学で学士号を取得し、2022年9月から上海大学のコンピュータ工学と科学学院で修士課程を開始しました。研究グループに参加した後、韓越興先生の指導の下、形状空間理論や画像生成に関する技術と応用を学びました。韓先生の丁寧な指導の下、以下の研究を行いました:
-
画像生成モデルがトレーニングサンプルが不足している場合や適切な事前トレーニングモデルがない場合に直面する課題に対処するために、事前形状空間の測地曲面情報転送に基づく画像生成方法を提案します。この方法は、モデルが非常に少ないサンプル分布を効果的に学習するのが難しいというボトルネックを克服し、高品質で多様な画像を生成することを目的としています。そのコアプロセスは次のとおりです。まず、少数のサンプルの深層特徴を抽出し、これらの特徴を使用して事前形状空間に測地曲面を構築し、非線形特徴強化を行います。次に、強化された特徴に基づいて擬似ソースドメインを構築し、豊富なデータ分布をシミュレートし、擬似ソースドメインからターゲットドメインへの情報転送を行います。最終的に、情報転送段階で補間監視と正則化制約を適用して最適化します。実験により、既存の方法と比較して、この方法は多領域データセットで生成画像の品質、詳細の豊かさ、および多様性を大幅に向上させ、モード崩壊を効果的に緩和し、生成画像が下流タスクを支援する可能性を示しました。
-
テキスト誘導型ゼロショット画像スタイル転送タスクの課題に対処するために、事前形状空間における測地曲面特徴強化に基づくゼロショットスタイル転送方法を提案します。この方法は、外部の新しいスタイル情報を事前トレーニングモデルに効率的に注入し、スタイルの一貫性とコンテンツの正確性を確保することを目的としています。具体的には、この方法は測地曲面特徴強化の考え方を事前トレーニング拡散モデルに基づくスタイル転送フレームワークに適用し、スライディングウィンドウクロッピングを組み合わせて局所情報を処理し、測地曲面特徴強化モジュールを利用して事前形状空間におけるスタイルとコンテンツ特徴の効果的な融合を促進します。実験結果は、この方法が追加のモデル微調整やスタイル参照なしで柔軟なテキスト誘導スタイル制御を実現し、ターゲットスタイルの画像を生成する際に、対照モデルと比較して元のコンテンツ構造をより良く維持できることを示しています。
卒業後、グエン・レ・ヘンさんは華為技術有限公司に入社します。上海大学での3年間を振り返ると、彼は努力して学び、真剣に研究を行い、専門能力を高め、多くの良き友人やメンターに恵まれました。グエン・レ・ヘンさんが今後の道のりで初心を忘れず、使命を胸に刻み、困難を乗り越え、前進し続けることを願っています。
論文リンク:基于形状空间理论特征增强的小样本图像生成方法研究与应用
コードリンク:https://github.com/P2i42/FAGStyle