凌晨帆、ご卒業おめでとうございます!

凌晨帆さんは、武漢生物工程学院で学士課程を修了し、2022年より上海大学計算機工学与科学学院にて学術型修士課程に在籍しました。研究室に加入してからは、張瑞教授・韓越興教授・陳侨川教授のご指導のもと、自然言語処理の分野で研究を行い、以下の成果を収めました。

既存の固有表現抽出(NER)手法において長スパン表現に十分な意味情報が不足しているという問題に対して、偶数畳み込みに基づくスパン表現強化モジュールを提案しました。本モジュールはエンティティスパン内部の意味情報を効果的に捉え、長スパンの特徴表現を強化し、長スパン認識の性能を向上させました。

既存の対比学習に基づくNERフレームワークが単一の対比次元に限定されるという制約に対して、スパンとカテゴリの二重対比学習目標を導入しました。スパン次元のみを最適化する方法と比較して、エンティティカテゴリの識別性に優れた表現を学習することができました。さらに、カテゴリ側では事前学習済み言語モデルの代わりに軽量な学習可能埋め込み層を採用し、性能を維持しつつモデルの効率を向上させました。

情報抽出手法においてサブタスク間の相互作用が不十分であるという限界に対して、知識移転手法を提案しました。これは、対比学習に基づくNERモデルのパラメータを関係抽出モデルへ移転することを目的としています。具体的には、NER段階で訓練されたテキストエンコーダを再利用することで、エンティティの文脈情報をより効果的に符号化できるようにしました。また、カテゴリエンコーダの移転に基づくカテゴリ認識融合モジュールを導入し、関係抽出段階におけるエンティティカテゴリの認識能力を強化しました。これら二つの移転メカニズムの協働により、エンティティ関係抽出の性能が向上しました。

卒業後、凌晨帆さんは順豊科技有限公司に入社し、ソフトウェア開発の仕事に従事します。上海大学での大学院生活において、彼は着実に研究を進め、専門的知識と研究能力を絶えず高め、また多くの優れた師や友人に恵まれ、豊かな経験を得ました。これからの道のりにおいても、理想を胸に、地に足をつけ、困難を恐れず、勇敢に前進し続けることを願っています。

論文リンク:対比学習と知識移転に基づく情報抽出手法の研究

コードリンク:https://github.com/han-yuexing/2025-thesis-lcf-code

最終更新:2025-09-22
アクセス数: 加载中...