STRIDE-ED:共感的対話システムのための戦略に基づく段階的推論フレームワーク

arXiv cs.CL / 2026/4/9

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、明示的な戦略と文脈に条件付けて応答生成の意思決定を行うことで、共感的対話を改善することを目的とした、戦略に基づく解釈可能な段階的推論フレームワーク「STRIDE-ED」を提案する。
  • これは、LLMベースのアノテーション、複数モデルにまたがる整合性に重み付けした評価、動的サンプリングを用いる戦略を意識したデータ洗練パイプラインを提示し、共感的戦略に整合した高品質な学習データの構築を目指す。
  • STRIDE-EDは、教師あり微調整と、複数目的の強化学習を組み合わせた二段階プロセスで訓練し、出力を目標とする感情、共感的戦略、応答フォーマットへより適切に整合させる。
  • 実験結果として、STRIDE-EDは複数のオープンソースLLMに対して汎化し、従来手法を自動評価指標と人手評価の両方で上回ると報告されている。
  • 本研究は、共感的対話を単一ステップの生成タスクではなく、複数段階の認知/意思決定問題として位置づけることで、包括的な戦略フレームワークの欠落や、戦略を意識した低品質データに起因する制約を低減することを狙っている。

Abstract

共感的な対話では、ユーザーの感情状態を認識するだけでなく、応答生成の全過程において戦略を意識した、状況に応じた意思決定を行うことが必要です。しかしながら、包括的な共感戦略の枠組みの欠如、明示的でタスクに整合した多段階推論、高品質な戦略を意識したデータが根本的に不足しているため、既存手法は、共感的な対話を複雑な多段階の認知および意思決定プロセスとして効果的にモデル化できないという制約を受けています。これらの課題に対処するため、我々は、構造化された、戦略条件付けの推論によって共感的対話をモデル化する STRIDE-ED(STRategy-grounded、Interpretable、DEep reasoning の枠組み)を提案します。効果的な学習を支えるために、LLMベースのアノテーション、多モデルの整合性に基づく重み付け評価、ならびに動的サンプリングを統合した、戦略を意識したデータ洗練パイプラインを構築し、共感戦略に整合した高品質な学習データを作成します。さらに、教師あり微調整と、多目的強化学習を組み合わせた二段階の学習パラダイムを採用し、モデルの振る舞いを目標とする感情、共感戦略、ならびに応答フォーマットにより適切に整合させます。大規模な実験の結果、STRIDE-ED は多様なオープンソース LLM にまたがって汎化でき、両方の自動指標および人手評価において一貫して既存手法を上回ることが示されました。