広告

言及するほどでもない? 顕著な命題注釈に関するパイロットスタディ

arXiv cs.CL / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、抽出的要約研究が重要な命題の回収に焦点を当てている一方で、命題の顕著性(salience)の段階づけは実世界データにおいて十分に実装・運用されていない点を指摘している。
  • SEE(Salient Entity Extraction)の系譜の研究で用いられた、段階付き要約に基づく顕著性指標を適応し、命題がどれほど顕著かを定量化する。
  • 著者らは新しい命題注釈タスクを定義し、それを小規模な複数ジャンルのデータセットに適用する。
  • 注釈者間一致を評価し、提案する顕著性指標を、RSTベースのディスコース解析で用いられるディスコース・ユニットの中心性概念に結びつける予備的分析を行う。

Abstract

抽出的要約に関する長い研究の伝統があるにもかかわらず(これは本質的に、あるテキスト中の最も重要な命題を回収することを目的とする)、自然に生起するデータにおいて段階付けされた命題の顕著性(salience)を実運用可能な形で取り扱うことに関しては、これまでほとんど研究が行われていない。本論文では、Salient Entity Extraction(SEE)に関する先行研究から、段階付けされた要約に基づく顕著性を指標として採用し、それを命題の顕著性を定量化するために適応する。われわれは注釈タスクを定義し、それを小規模な複数ジャンルのデータセットに適用し、合意度を評価するとともに、初期的な調査として、提案する指標と、Rhetorical Structure Theory(RST)に従った談話パースにおける談話ユニットの中心性という概念との関係を検討する。

広告