文の理解における構文に導かれた情報保持

arXiv cs.CL / 2026/5/1

📰 ニュースModels & Research

要点

  • 本論文は、リアルタイムな文理解において人は文脈内の情報を一様に保持するのではなく、将来の予測にとって重要なものだけを選択的に保持すると主張する。
  • 情報保持の認知コストは、「予測されるヘッドの数」と「未完の依存関係の数」の2つの要因によって決まると提案している。
  • 先行研究でこれらの要因が互いに代替的・競合的な説明として扱われてきたのに対し、本研究は両者が一方に還元できないことを予測している。
  • 自然な読みに基づく日本語の読書時間データを用い、2つのコスト要因が特に明確に対比できる言語設定で、その主張を支持する結果を示した。
  • さらに、保持のために遅くなる読者ほど予測可能性からより大きな利益を得るというトレードオフも確認され、提案された「構文に導かれた保持」モデルを補強する証拠となっている。

Abstract

文脈の中で情報を保持することは、成功するリアルタイムの言語理解において不可欠ですが、保持は認知的にコストがかかり、処理を遅らせる可能性があります。我々は、合理的な言語使用者が統語構造によって導かれ、将来の予測にとって重要な情報を選択的に保持すると仮説を立てます。この見方では、保持コストに影響する要因は2つあります。予測されるヘッドの数と、不完全な依存関係の数です。これらの要因は先行研究において競合する仮説として扱われてきましたが、我々の説明は、それらが互いに一つへ還元できないことを予測します。日本語の自然主義的な読書時間データを用いて、この点が成り立つことを示します。日本語は、この2つの要因の対比が特に明確な言語です。さらに、保持のために読みが遅くなる読者は、予測可能性からより大きな利益を得る傾向がある、というトレードオフの存在も示し、提案した説明への追加的な支持を与えます。