意味論的アノテーション付きコーパスから大規模・広範囲の構成文法を学習する方法

arXiv cs.CL / 2026/3/16

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、句構造と意味フレームでアノテーションされたコーパスから、大規模・広範囲の構成文法を学習する方法を提案する。
  • 学習された文法は、Fluid Construction Grammar フレームワーク内で数万の構成から成るネットワークを形成し、オープンドメインのテキストのフレーム意味論的分析を可能にする。
  • 本研究は、利用ベースの構成文法アプローチのスケーラビリティを示し、網羅的コーパスにおける英語の格構造を研究するための実用的リソースを提供する。
  • このアプローチは、訓練データに含まれる統語-意味の使用パターンに関する豊富なデータを生み出し、下流の言語分析や応用を支援する。

要旨: 私たちは、言語使用のコーパスから大規模かつ広範囲をカバーする構成文法を学習する方法を提示します。句構造と意味フレームで注釈付けされた発話を出発点として、この方法は、統語構造と言語が表す意味関係との複雑な結びつきを捉える、人間に解釈可能な計算的構成文法の学習を促進します。得られた文法は、Fluid Construction Grammar フレームワーク内で形式化された、数万の構成表現のネットワークから成ります。これらの文法は、オープンドメインのテキストのフレーム意味分析を支援するだけでなく、学習元データに存在する、統語-意味的使用パターンに関する情報を豊富に含んでいます。方法と学習済み文法は、言語の使用ベースの構成主義的アプローチのスケールアップに貢献します。いくつかの基本的な構成文法のスケーラビリティを裏付けるとともに、広範囲のコーパスにおける英語の格構造研究を構成主義的に行うための実用的な道具も提供します。