細かな視点の捉え方:注釈者別の根拠(ラショナール)で説明をモデル化する

arXiv cs.CL / 2026/4/24

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、注釈者が提供する説明(根拠)と注釈者ごとのラベル予測を同時にモデル化し、個々の視点を表す細かなシグナルとして活用する枠組みを提案している。
  • 「User Passport」と呼ばれる表現レベルの仕組みにより、注釈者のアイデンティティと人口統計(デモグラフィ)メタデータの両方を条件付けして、モデル挙動のパーソナライズを狙う。
  • 説明生成のために、ポストホックのプロンプトベース説明器と、分類器の注釈者条件付き表現を生成モデルへ直接引き継ぐ「prefixed bridge」型の2つのアーキテクチャを提示している。
  • 実験では、注釈者ごとの説明を組み込むことで予測性能がベースラインの注釈者対応型分類器より改善し、prefixed bridgeはラベル整合性の安定性と意味的一貫性が高い一方、ポストホックは語彙レベルの類似性が強いことを示している。
  • これらより、注釈者別の根拠を予測部と生成部の双方に統合することで、意見(不一致)の表現をより忠実に行うパースペクティビスト・モデリングの進展につながる。

要旨: モデリングの観点として分解されたラベルを探索することを超えて、注釈者の根拠(rationale)は、個々の観点に対するきめ細かな信号を提供します。本研究では、注釈者固有のラベル予測と、それに対応する説明を共同でモデル化するための枠組みを提案します。この枠組みは、注釈者が提供した根拠(rationale)に対して微調整されます。分解された自然言語推論(NLI)の注釈と、注釈者が提供した説明を含むデータセットを用いて、表現レベルのUser Passportメカニズムを通じて、注釈者のアイデンティティと属性(demographic)メタデータの両方に基づいて予測を条件付けます。さらに、2つの説明生成アーキテクチャを導入します。1つは事後的(post-hoc)なプロンプトベースの説明器、もう1つは、注釈者に条件付けされた分類器の表現を直接生成モデルへと移送する、プリフィックス付きブリッジ説明器です。この設計により、個々の注釈者の観点に整合した説明生成が可能になります。結果として、説明のモデル化を取り入れることは、注釈者を意識したベースライン分類器と比べて、予測性能を大幅に改善することが示されました。プリフィックス付きブリッジ手法は、より安定したラベル整合と高い意味的一貫性を達成し、一方で事後的手法は語彙レベルの類似性がより強いことが分かりました。これらの知見は、説明をきめ細かな観点の表現としてモデル化することで、意見の相違(disagreement)をより豊かに、かつ忠実に表現できることを示しています。提案手法は、注釈者固有の根拠を、予測成分と生成成分の両方に統合することで、パースペクティビズム(perspectivist)に基づくモデリングを前進させます。