AI Navigate

LLM時代の語義誘導は未解決のまま

arXiv cs.CL / 2026/3/13

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • センスアノテーション付きデータが欠如している状況では語義誘導が未解決のままであると主張し、SemCor由来の評価を提示して多義性と頻度分布を尊重します。
  • 著者らは事前学習済み埋め込み表現とクラスタリングを品詞間でベンチマークし、英語のLLMベースWSI手法を提案・評価するとともに、データ拡張とWiktionaryを用いた半教師付き設定を検討します。
  • 主要な発見は、いかなる無監督手法も単純な「lemmaごとに1クラスタ」というヒューリスティックを上回らないことであり、結果は品詞によって異なり、LLMはこのタスクに対して限定的な効果しか示しませんでした。
  • これらの課題にもかかわらず、データ拡張(Wiktionaryを用いた半教師付き監督を含む)は性能を改善し、従来の最先端をテストセットで約3.3%上回り、LLMsの語彙意味論機能の向上が求められることを強調しています。
要旨: センスアノテーション付きデータが欠如している場合、語義誘導(WSI)は、特に低リソースまたはドメイン特化設定において、語義解決の有力な代替手段です。本論文では、現在のWSI評価における方法論的問題を強調します。SemCor由来のデータセットでの評価を提案し、元のコーパスの多義性と頻度分布を尊重します。品詞ごとに事前学習済み埋め込み表現とクラスタリングアルゴリズムを評価し、英語向けのLLMベースWSI手法を提案・評価します。データ拡張源(LLM生成、コーパスおよび語彙辞典)を評価し、Wiktionaryを用いたデータ拡張、must-link制約、lemmaごとのクラスタ数を用いた半教師付き設定を検討します。いかなる無監督手法(本手法か過去の手法かを問わず)も、強力な「lemmaごとに1クラスタ」というヒューリスティック(1cpl)を上回らないことを発見しました。また、結果と最適システムは品詞によって異なる場合があり、LLMはこのタスクを実行するのに困難を伴うこと、データ拡張は有益であること、Wiktionaryを活用することは役立つことを示します。私たちのテストセットでは従来のSOTAシステムを約3.3%上回る成果を報告しています。WSIは未解決であり、語彙辞典とLLMの語彙意味論的能力をより適切に説明・活用する必要があると訴えています。