要旨: 文の意味を完全に捉えるには、意味表現は出来事の内部的な時間構造を記述する側面(アスペクト)をエンコードすべきである。Uniform Meaning Representations(UMR)などのグラフベースの意味表現フレームワークにおいて、側面は、出来事が時間の経過とともにどのように展開するかを理解するのに役立ち、状態、活動、完了した出来事といった区別を含む。重要であるにもかかわらず、側面は意味の表現を扱う各種フレームワークにおいて、いまだ十分に注釈されていない。これにより、現在の手作業による注釈が妨げられるだけでなく、側面に関する情報を予測できる自動システムの開発も阻害されてきた。本論文では、特徴量を欠いた Abstract Meaning Representation(AMR)グラフ上で UMR 側面ラベルが付与された英語文の新しいデータセットを導入する。さらに、UMR 側面格子に従って出来事性をもつ述語にラベル付けするために用いた注釈スキームおよびガイドライン、ならびに複数ステップの裁定プロセスによりアノテータ間の一貫性と品質を担保するために用いた注釈パイプラインについて述べる。将来の自動化に対するデータセットの有用性を示すために、3 つのモデリング手法によるベースライン実験を提示する。我々の結果は、自動 UMR 側面予測のための初期ベンチマークを確立するとともに、意味表現により広く側面を統合するための基盤を提供する。
アスペクト分類によって構造化された意味表現を強化する
arXiv cs.CL / 2026/3/27
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、出来事の内部的な時間的構造であるアスペクトを、意味の表現に明示的に符号化することで、状況が時間とともにどのように展開するかをより適切に表現できると主張する。
広告




