王輝、卒業おめでとう!

王輝、本科卒業は延辺大学、2022年9月から上海大学計算機工学部で修士課程を開始し、研究グループに参加後、韓越興教授の指導の下、自然言語処理などの関連技術と応用を学び、以下の研究を完了しました:

  1. 大規模言語モデルの科学文献におけるエンティティ抽出の可能性を引き出すために、文脈に一貫したエンティティの明示的なアノテーション手法と二段階のトレーニング手法を提案し、大規模言語モデルの生成的出力と命名エンティティ認識タスクの系列アノテーション特性の違いを解決します。次に、トレーニング段階は監視微調整と直接的な好みの最適化の2つの段階に分かれ、監視微調整段階では既存のアノテーションデータで基本的なエンティティ認識能力を学習します。直接的な好みの最適化段階では、モデルが誤りを修正するためのより効果的なガイダンスを提供するために、負のサンプル構築時にエンティティの境界を拡張および収縮し、監視微調整後の推論結果をフィルタリングしてカテゴリ混乱サンプルを生成します。正負サンプルペアの好みの差を利用して制約を強化し、モデルの誤判定修正能力を向上させます。

  2. 材料科学や生物医学のような高度に専門化された領域を汎用モデルで扱う場合、低頻度の専門用語が多く、名前付き実体の認識精度が不十分であるという問題を解決するために、本論文では、異なるドメイン言語モデルとドメイン単語レベルベクトルを意味的に融合することで、科学文献のより深い意味理解を強化するドメイン言語モデルに基づく意味融合手法を提案し、材料科学や生物医学分野の複雑な専門化されたテキストに対して、実験によりその有効性を検証する。本手法の有効性は、材料科学と生物医学分野の複雑な専門テキストに対して実験的に検証される。最後に、本手法を特定の分野に適用し、3種類の高硬度合金を設計することで、科学的テキストマイニングと研究開発の意思決定支援における実用的価値を示す。

卒業後、王輝さんは維沃モバイル通信会社に入社します。王輝さんは上海大学での3年間の大学院生活の中で、熱心に学び、研究プロジェクトに参加しました。複雑な問題に対して迅速に分析し、効果的な解決策を提案する能力を示し、独立した研究能力と革新意識を持っています。王輝さんが今後の道のりで初心を忘れず、困難を乗り越え、前進し続けることを願っています。

論文リンク:面向科学文献的命名实体识别研究与应用

コードリンク:https://github.com/han-yuexing/2025-thesis-wh-code