クリック数より品質を:コールドスタートEC向けクエリ提案のための、本質的な品質駆動型反復強化学習
arXiv cs.CL / 2026/3/25
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、既存のLLM+CTRアプローチが、CTRモデル学習に必要なクリックデータが十分でないために性能が低下するコールドスタートECのクエリ提案(EQS)を扱う。
- 提案手法Cold-EQSは、回答可能性・事実性・情報利得に基づく報酬により提案の品質を最適化する、反復型強化学習フレームワークである。
- Cold-EQSは、グループ化された候補提案クエリに対する不確実性を推定することで、難しく曖昧なサンプルを選択し、クリック信号なしでユーザーのクエリから学習できるようにする。
- 著者らは、オフライン学習と評価のための16,949件のオンラインユーザークエリからなるEQS-Benchmarkを導入し、再現可能な実験を支援する。
- 実験により、オフラインとオンラインの有効性に正の相関があることを示し、従来手法に対してオンラインのchatUVが+6.81%有意に改善したと報告している。




