広告

クリック数より品質を:コールドスタートEC向けクエリ提案のための、本質的な品質駆動型反復強化学習

arXiv cs.CL / 2026/3/25

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、既存のLLM+CTRアプローチが、CTRモデル学習に必要なクリックデータが十分でないために性能が低下するコールドスタートECのクエリ提案(EQS)を扱う。
  • 提案手法Cold-EQSは、回答可能性・事実性・情報利得に基づく報酬により提案の品質を最適化する、反復型強化学習フレームワークである。
  • Cold-EQSは、グループ化された候補提案クエリに対する不確実性を推定することで、難しく曖昧なサンプルを選択し、クリック信号なしでユーザーのクエリから学習できるようにする。
  • 著者らは、オフライン学習と評価のための16,949件のオンラインユーザークエリからなるEQS-Benchmarkを導入し、再現可能な実験を支援する。
  • 実験により、オフラインとオンラインの有効性に正の相関があることを示し、従来手法に対してオンラインのchatUVが+6.81%有意に改善したと報告している。

広告