会話型LLMエージェントにおけるユーザー嗜好モデリング:リトリーバル併用インタラクションから得られる弱い報酬

arXiv cs.CL / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、VARS(Vector-Adapted Retrieval Scoring)という、会話型LLMエージェントにおけるリトリーバルをバイアスするために、長期ベクトルと短期ベクトルを用いて永続的なユーザー嗜好表現を構築する、パイプラインに依存しない枠組みを提案する。
  • VARSは、ユーザーごとの微調整を避けつつセッションをまたいだパーソナライズを可能にするために、弱いスカラーのフィードバック信号のみでオンラインにユーザー嗜好ベクトルを更新する。
  • 数学およびコード課題におけるMultiSessionCollabベンチマークでの実験では、ユーザーを考慮したリトリーバルは、凍結したLLMバックボーンのもとで大きな生の精度向上をもたらすというよりも、タイムアウトの削減やユーザーの負担(努力)の低減といったインタラクション効率の改善に主に寄与することが示される。
  • 提案するデュアルベクトル設計は解釈可能であるとして評価され、長期ベクトルはユーザー間の嗜好の重なりを反映し、短期ベクトルはセッション固有のふるまいに適応する。
  • 著者らは、関連するGitHubリポジトリを通じてコード、モデル、データを提供し、再現性と、ユーザー嗜好を考慮したリトリーバル手法のさらなる発展を支える。