目標指向の代替案にもとづくサプライズ最小化が対話における発話選択を予測する

arXiv cs.CL / 2026/5/4

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、発話生成を情報理論的なコスト概念にもとづく、文脈上の代替候補の中からの確率的・コスト感応的な選択として捉えます。
  • 固定された伝達意図を実現する目標指向の代替案と、文脈的なもっともらしさだけで定義される目標非依存の代替案を区別することで、コスト指標を話し手/聞き手の観点から解釈できるようにしています。
  • 代替案セットの両タイプを言語モデルで生成する手順を提案し、その後、開かれた対話における生産選好を決定論的および確率論的なコスト最小化の下で分析します。
  • 結果として、目標指向の代替案に対するサプライズ(驚き)の最小化が、両方の分析枠組みにおいて最も強い予測力を示したと報告されています。
  • さらに、本研究は、LMで生成した代替案に対して目的と文脈を条件付けた最適化を行うことが、自然な言語生成における話し手と聞き手の圧力を調べるための原理的な枠組みになることを示唆しています。

Abstract

発話産出を、情報理論的なコスト概念を用いた、文脈上の代替案に対する確率的かつコスト感受的な選択としてモデル化します。我々は、固定された伝達意図を実現する目標指向的な代替案と、文脈上のもっともらしさだけで定義される目標非依存的な代替案を区別します。これにより、異なるコスト指標に関する話し手および聞き手志向の解釈を導出できるようになります。我々は言語モデルを用いて、両タイプの代替案集合を生成する手順を提示します。決定論的および確率的なコスト最小化の両方のもとで、オープンエンドな対話における産出の選択を分析した結果、目標指向的な代替案に対するサプライズ(驚き)最小化が、両分析において最も強い予測的説明を与えることが分かりました。一方で、一様な情報密度や長さに基づくコストは、条件をまたいでより弱く、予測力が一貫しません。より広く言えば、本研究は、LM生成の代替案を条件とした代替案条件付き最適化が、自然な言語産出における話し手と聞き手の圧力を研究するための原理的な枠組みを提供することを示唆しています。